10/018094 

. jq^ec'd.PCT/Pfo l 4 DEC 2001 



(Nucleotide) FAST A of: Hn540-l.Dna from: 1 to: 3705 September 25, 19100 23:27 

REFORMAT of: Hn540-l.Dna check: 5366 from: 1 to: 3705 September 25, 19100 
13:37 

(No documentation) 

TO: @USER_DISK: [Z8SE007] 134608 . $TMP Sequences: 7, 218,604 Symbols: -151, 773,6 
69 Word Size: 6 

Sequences too short to analyze: 62 (231 symbols) 

Databases searched: 

EMBL, Release 63.0, Released on 10Jun2000, Formatted on 10Jul2000 
EMBL, Release 63.0, Released on 17Jun2000, Formatted on 17Jul2000 
EMBL, Release 63.0, Released on 25Jun2000, Formatted on 25Jul2000 
EMBL, Release 63.0, Released on 6Jun2000, Formatted on 6Jul2000 



EMBL, Release 63.0, Released on 14Jun2000, Formatted on 14Jul2000 

EMBL, Release 63.0, Released on 19Jun2000, Formatted on 19Jul2000 

EMBL, Release 63.0, Released on 20Jun2000, Formatted on 20Jul2000 

EMBL, Release 63.0, Released on HJun2000, Formatted on HJul2000 

EMBL, Release 63.0, Released on 18Jun2000, Formatted on 18Jul2000 

GeneSeq, Release 40.4, Released on 22Jun2000, Formatted on 22Jun2000 

EMBL, Release 63.0, Released on 3Jun2000, Formatted on 3Jul2000 

EMBL, Release 63.0, Released on 4Jun2000, Formatted on 4Jul2000 

EMBL, Release 63.0, Released on 5Jun2000, Formatted on 5Jul2000 

EMBL, Release 63.0, Released on 7Jun2000, Formatted on 7Jul2000 



Searching with both strands of the query. 
Scoring matrix: GenRunData : Fastadna . Cmp 
Constant pamfactor used 

Gap creation penalty: 16 Gap extension penalty: 4 
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Results sorted IBr z-values calculated from init^^ore 
1673 scores saved that exceeded 116, Joining threshold: 91, opt. width: 16 

The best scores are: initl initn opt z-sc E ( 14420799 ). . 



Emrod:Afl25521 Begin: 1 End: 3705 

! Af 125521 Rattus norvegicus nephrin ...18525 18525 18525 25999.4 

Emrod:Af 161715 Begin: 458 End: 4162 

! Af 161715 Rattus norvegicus nephrin ...18452 18452 18453 25893.3 

Emrod:Af 168466 Begin: 24 End: 3481 

! Af 168466 Mus musculus nephrin (Nphs ... 14308 
Emhuml:Af 035835 Begin: 24 End: 3497 
! Af 035835 Homo sapiens nephrin (NPHS ... 11557 
GcgJSeneseqJD: Z25338 Begin: 24 End: 3497 
! Human nephrin nucleotide sequence. ...11557 
Emhum3:Hsac2133 Begin: 14708 End: 14893 
! Ac002133 Human DNA from chromosome . . . 651 
Emhtg5 :Ac022315 Begin: 169005 End: 169234 
! Ac022315 Homo sapiens chromosome N/ . . . 653 
Emhum6:Hsu95090 Begin: 33243 End: 33369 
! U95090 Homo sapiens chromosome 19 c... 448 



15239 


14974 


21379 


. 6 


0 


12214 


12066 


17125 


. 7 


0 


12214 


12066 


17125 


. 7 


0 


Strand 










4463 


651 


6211 


. 3 


0 


2207 


700 


3028 


. 6 


0 


Strand 










1773 


455 


2430 


. 1 


0 



Emest_Mam: Aw347107 Begin: 1 End: 426 

! Aw347107 30251 MARC 1PIG Sus scrofa... 1431 1431 1437 1983.9 0 
Emgss6:Aq522774 Begin: 252 End: 437 

! Aq522774 HS_522 1_B1_E 1 0JT7A RPCI-1 1 . . . 586 956 603 1314.0 0 
\\End of List 



Hn540-l.Dna 
Emrod:Af 125521 



ID AF125521 standard; RNA; ROD; 3705 BP. 

AC AF125521; 

SV AF125521.1 

DT 23-NOV-1999 (Rel . 61, Created) 

DT 23-NOV-1999 (Rel. 61, Last updated, Version 1) 

DE Rattus norvegicus. nephrin mRNA, complete cds . 
KW 

OS Rattus norvegicus (Norway rat) 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; ' Mammalia; 

OC Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Rattus. 

RN [ 1 ] 

RP 1-3705 

RX MEDLINE; 99419238. 

RA Ahola H., Wang S.X., Luimula P., Solin M.L., Holzman L.B., Holthofer H.; 

RT "Cloning and expression of the rat nephrin homoiog"; 

RL Am. J. Pathol. 155 (3) : 907-913 (1999) . 

RN [2] 

RP 1-3705 

RA Ahola H., Wang S . -X .' , Luimula P., Solin M.-L., Holzman L.B., Holthofer H.; 
RT 

RL Submitted ( 03-FEB-1999 ) to the EMBL/ GenBank/DDBJ databases. 

RL Haartman Institute/ Division of Bacteriology and Immunology, University of 

RL Helsinki, P.O. Box 21 (Haartmaninkatu 3), Helsinki 00014, Finland 

DR SPTREMBL; Q9R044; Q9R044. 



FH Key Location/Qualifiers 
FH 

FT source 1. .3705 

FT /db_xref="taxon: 10116" 

FT /organism="Rattus norvegicus" 

FT /st rain="Sprague-Dawley" 

FT /tissue_type="kidney glomeruli" 

FT /dev__stage="one month" 

FT CDS 1. .3705 

FT /codon start=l 



/ 
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FT / db__xref =" SPTREMBL : Q9R044 " 

FT /product="nephrin M 

FT /protein__id="AAF12734. 1" 

FT /translation="MSSLTPLLLMGMLTSGLAESPVPTSAPRGFWALSENLTAVEGTTV 

FT KLWCGVRAPGSWQWAKDGLLLGPNPKMPGFPRYSLEGDRAKGEFHLLIEACDLSDDM 

FT YECQVGRSE LGPE LVS PKVI LS I LVS PKVLLLTPEAGSTVTWVAGQE YVVTCVSGDAKP 

FT APDITFIQSGRTILDVSSNVNEGSEEKLCITEAEARVIPQSSDNGQLLVCEGSNPALDT 

FT PIKAS FTMNILFPPGPPVIDWPGLNEGHVRAGENLELPCTARGGNPPATLQWLKNGKPV 

FT STAWGTEHAQAVAHSVLVMTVRPEDHGARLSCQSYNSVSAGTQERSITLQVTFPPSAIT 

FT ILGSVSQSENKNVTLCCLTKSSRPRVLLRWLGGRQLLPTDETVMDGLHGGHISMSNLT 

FT FLVRREDNGLPLTCEAFSDAFSKETFKKSLTLNVKYPAQKLWIEGPPEGQYIRTGTRVR 

FT LVCLAIGGNPDPSLIWFKDSRPVSEPRQ.PQEPRRVQLGSVEKSGSTFSRELVLI IGPPD 

FT NRAKFSCKAGQLSASTQLWQFPPTNLTI LANSSALRPGDALNLTCVSISSNPPVNLSW 

FT DKEGERLEDVAAKPQSAPFKGSAASRSVFLRVSSRDHGQRVTCRAHSEALRETVSSFYR 

FT FNVLYPPEFLGEQVRAVTWEQGQVLLPVSVSANPAPEAFNWTFRGYRLSPAGGPRHRI 
FT 

LSGGALQLWNVTRADDGFYQLHCQNSEGTAEALLKLDVHYAPTIRALRDPTEVNVGGSV 

SCORES Initl: 18525 Initn: 18525 Opt: 18525 z-score: 25S99.4 E(): 0 



100.0% identity in 3705 bp overlap 

10 20 30 40 50 60 

ATGTCCAGTTTGACTCCCCTGCTGCTCATGGGAATGCTGACCTCAGGCCTGGCCGAGTCG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i i I I I I ! I I I I I II I I i I I I I I I 

ATGTCCAGTTTGACTCCCCTGCTGCTCATGGGAATGCTGACCTCAGGCCTGGCCGAGTCG 
10 20 30 40 50 60 



70 80 SO 100 110 120 

CCAGTCCCCACCTCAGCACCTCGAGGCTTCTGGGCTCTGTCTGAAAACCTG.ACTGCGGTG 

I I I I i M I I I I I I I I I I I I! I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I II II I I I I 

CCAGTCCCCACCTCAGCACCTCGAGGCTTCTGGGCTCTGTCTGAAAACCTGACTGCGGTG 
70 80 SO 100 110 120 

130 140 150 160 170 * 180 

GAAGGGACAACAGTTAAGCTATGGTGCGGTGT CAGGGCCCCTGGCAGTGTGGTGCAGTGG 

I I I I I I I I I I I I I I i I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I 

GAAGGGACAAC AGT T AAGC T AT GGT GC GGT GT CAGGGC C C CT GGCAGT GT GGT GCAGT GG 
130 140 150 160 170 180 

190 200 210 220 230 240 

GCTAAGGATGGGCTGCTTCTGGGTCCAAACCCGAAGATGCCAGGCTTCCCGA.GGTACAGC 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I ! I I I I I I I ! I I ! I ! I I I I I I I I I I I I I 
GCTAAGGATGGGCTGCTTCTGGGTCCAAACCCGAAGAT GCCAGGCTTCCCGAGGTACAGC 

190 200 210 . 220 230 240 

250 260 270 280 290 300 

CTGGAAGGAGATCGTGCTAAAGGCGAGTTCCACCTGCTTATTGAAGCCTGTGACCTCAGT 
I I I I I I I I I I I I I I I I I ! I I 1 I I I I I I I I I! I I i I I I I I I I 1 I I I I I I I I I i I I I 1 I I I I 

CTGGAAGGAGATCGTGCTAAAGGCGAGTTCCACCTGCTTATTGAAGCCTGTGACCTCAGT 
250 260 270 280 290 300 

310 320 330 340 350 . 360 

GAT GAC GCAGAGT AT GAAT GCCAAGT C GGCCGCT CAGAGTTGGGT C C C GAGCT T GT GTCT 



Hn540-l.Dna 
Af 125521 

Hn540-l.Dna 
Af 125521 

Hn540-1 .Dna 
Af 125521 

Hn540-1 .Dna 
Af 125521 

Hn540-1 .Dna 
Af 125521 

Hn540-l.Dna 
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Af 125521- 



i i \imr\ i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 m*r\ i ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GAT GACGCAGAGT AT GAAT GCCAAGT CGGCCGCT CAGAGTT GGGT CCC GAGCT T GT GT CT 
310 320 330 340 350 360 



Hn540-l.Dna 



370 380 390 400 410 420 

CCTAAAGTAATCCTCTCCATTCTAGTTTCCCCCAAGGTGCTTCTGTTGACCCCCGAGGCA 



I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I .! I I I I I I I I I I I I I I I I I 

Af 12 5521 CCTAAAGTAATCCTCTCCATTCTAGTTTCCCCCAAGGTGCTTCTGTTGACCCCCGAGGCA 

370 380 390 400 410 420 



Hn540-l.Dna 



Af 125521 



430 440 450 460 470 480 

GGAAGCACAGTGACCTGGGTAGCTGGGCAGGAGTATGTGGTCACCTGTGTGTCTGGGGAT 

I I I I i I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I 

GGAAGC AC AGT GAC CT GGGT AGCT GGGC AGGAGT AT GT GGT C AC CT GT GT GT CT GGGGAT 
430 440 450 460 470 480 



490 



500 



510 



520 



530 



540 



Hn540-1 .Dna 



Af 125521 



GC AAAAC C AGC AC C T GAC AT CAC CT T CAT C C AGAGT GGAC GAAC T AT ATT GGAC GT C T C C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCAAAAC C AGC AC CT GACAT CAC C T T CAT C C AGAGT GGAC GAAC TAT AT T GGAC GT C T C C 
490 500 510 520 530 540 



Hn540-l.Dna 



Af 125521 



550 560 570 580 590 600 

T C CAAT GT GAAT GAGGGAT C AGAGGAGAAACT CT GC AT C AC AGAGGC C GAAGC CAGGGT G 

I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I i I I ! I I I I I I I I I I I I I I I i I I I I I I I I I 

T C CAAT GT GAAT GAGGGAT C AGAGGAGAAAC T C T GCAT CAC AGAGGC C GAAG C CAGGGT G 
550 560 570 580 590 600 



Hn540-l.Dna 



Af 125521 



610 620 630 640 650 660 

ATACCCCAGAGCTCGGATAACGGGCAGTTACTGGTCTGTGAGGGTTCCAACCCAGCTTTG 

I l I I 1 1 i I I I I I I I I 1 1 I I I I I I 1 1 I I I i I 1 1 I I 1 1 I l l I l l l I l l l I l l l I l i l l l I i I 

ATACCCCAGAGCTCGGATAACGGGCAGT TACT GGT CTGTGAGGGTTCCAACCC AGCT TTG 
610 620 630 640 650 660 



Hn540-1 . Dna 



Af 125521 



670 680 690 700 710 720 

GAC AC T C C C AT AAAGGCT T CAT T CAC CAT GAAT AT T CT GT T T C C C C C AGGAC C T C CT GT C 

I I I I i I I I i I I I I I II I II I I I I I I I I I I U I I 1 I I I I I I I I i I II II I I I I I I I I ! I I I 

GAC ACT C C CAT AAAGGCT T CAT T CAC CAT GAAT AT T CT GT T T C C C C C AGGAC C T C CT GT C 



670 



680 



690 



700 



710 



720 



Hn540-1 . Dna 



Af 125521 



730 740 750 760 770 780 

ATT GAT T GGC CAGGCCT GAAT GAAGGGCAT GT GAGGGCAGGGGAGAAC CT GGAGCT GC C C 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I M I I I I I I I I I I I I I 

ATTGATT GGC CAGGCCT GAAT GAAGGGCAT GTGAGGGCAGGGGAGAACCTGGAGCTGCCC 
730 740 750 760 770 780 



790 800 810 820 830 840 

Hn54 0-1 . Dna TGCACAGCCAGAGGTGGCAATCCACCTGCTACCCTGCAGTGGCTGAAGAACGGTAAACCA 

I I I I I M I I I I M I I I I I I I M I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I 

Af 125521 TGCACAGCCAGAGGTGGCAATCCACCTGCTACCCTGCAGTGGCTGAAGAACGGTAAACCA 

790 800 810 820 830 - 840 



Hn540-l.Dna 



Af 125521 



850 860 870 880 890 . 900 

GT GT C C AC AGC CT GGGGC AC C GAGC AT GC C CAGGC AGT GGC C CAC AGT GTGCTGGTGATG 

I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I J II I I I I I I I I I I I I II I I I I I I I I I I I I 

GTGTCCACAGCCTGGGGCACCGAGCATGCCCAGGCAGT GGC CCACAGT GTGCTGGTGATG 
850 860 870 880 890 900 



Hn540-1 . Dna 



910 920 930 940 950 960 

AC T GT AC GAC CT GAAGAC CAT GGAGC T C GGC T CAGC T GT CAGT C CT AC AACAG C GT GT C T 



I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I i I I I I I I I I I I 
Af 125521 ACT GTAC GAC CT GAAGAC CAT GGAGCT CGGCTCAGCTGT CAGT CCTACAACAGCGTGTCT 

910 920 930 940 950 960 
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^^970 980 990 J^P> 1010 1020 

Hn540-1 . Dna GCAGGGACCCAGGAGAGAAGCATCACACTACAGGTCACCTTTCCCCCAAGCGCCATTACC 

I I | I I I M I I I I I I I I I I I I I I I I I I M I II I I I II I II II I I I I I I I I I I I I I I I I I I I 

Af 1 2 5 5 2 1 GC AGGGAC C C AGGAGAGAAGC AT C AC ACT AC AGGT C AC CTTTCCCC C AAGC GC CAT T AC C 

970 980 990 1000 1010 1020 

1030 1040 1050 1060 1070 1080 

Hn540-1 . Dna AT C C T GGGAT CT GT AT CACAAT C GGAGAACAAGAAC GT GAC C C T T T GCT GC C T GAC C AAG 

I M | ! I I I I I I II I I I I ! I I I I I i I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Af 12 5521 AT C C T GGGAT C T GT AT CACAAT C GGAGAACAAGAAC GT GAC CCTTTGCT GC C T GAC C AAG 

1030 1040 1050 1060 107 0- 1080 

1090 1100 1110 1120 1130 1140 

Hn54 0-1 . Dna TCCAGTCGCCCACGGGTCCTGCTGCGATGGTGGTTGGGTGGACGGCAGCTGCTGCCCACA 
I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I M I I I I I I I I I I I I !! I I I M I I I I I I I 
Af 12 5521 TCCAGTCGCCCACGGGTCCTGCTGCGATGGTGGTTGGGTGGACGGCAGCTGCTGCCCACA 

1090 1100 1110 1120 1130 1140 



1150 1160 1170 1180 1190 1200 

Hn54 0 - 1 . Dna GAT GAGACAGT CAT GGAT GGC CT GCAT GGT GGCCACAT CT CCAT GT CCAAT CT CAC AT T C 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M II I I I I I I I I I I I I 

Af 12 552 1 GAT GAGACAGT CAT GGAT GGC C T GCAT GGT GGC CAC AT CT C CAT GT C C AAT CT C ACAT T C 

1150 1160 1170 1180 1190 12 00 

1210 122 0 1230 1240, 1250 1260 

Hn5 40-1 . Dna TTGGTGCGGAGAGAAGACAATGGCCTGCCCCTCACGTGTGAAGCCTTCAGTGAC GCCTTC 

I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Af 12 5521 TT GGT GCGGAGAGAAGACAAT GGC CTGCCCCT CAC GTGT GAAGCCTTCAGT GAC GCCTTC 

1210 1220 1230 1240 12 50 12 60 

1270 1280 1290 1300 1310 1320 

Hn54 0 - 1 . Dna AGC AAGGAGAC C T T CAAGAAGT C ACT CAC CT T GAAT GT GAAAT AC C CT GC C C AGAAGCT G 
I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I II I I I I I I II I I I I I II I I I I I I I I I I I I I 
Af 12 5 521 AGCAAGGAGACCTT CAAGAAGT CACT CAC CTT GAAT GT GAAAT AC CCTGCCCAGAAGCTG 

127Q 1280 1290 1300 1310 1320 

1330 1340 1350 1360 1370 1380 

Hn54 0- 1 . Dna TGGATTGAGGGGCCCCCAGAGGGACAGTACATCCGGACTGGGACTCGGGTGAGGCTGGTA 

1 1 1 1 1 1 1 1 1 1 1 ii ii 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 

Af 125521 TGGATTGAGGGGCCCCCAGAGGGACAGTACATCCGGACTGGGACTCGGGTGAGGCTGGTA 

1330 1340 1350 1360 1370 1380 

1390 1400 1410 1420 1430 1440 

Hn54 0-1 . Dna TGCTTGGCCATCGGAGGCAACCCAGACCCCTCCCTCATCTGGTTTAAGGATTCACGTCCG 
I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I 1 I I i I M I I I I I 1 I I I I I I I 1 \ I I I 1 I I 
Af 12 5521 TGCTTGGCCATCGGAGGCAACCCAGACCCCTCCCTCATCTGGTTTAAGGATTCACGTCCG 

1390 1400 1410 1420 1430 1440 

1450 1460 1470 1480 1490 1500 

Hn540-1 . Dna GT GAGC GAGC C CCGGCA.GCC C CAGGAGC CC C GGC GT GT GC AGCT GGGCAGT GT GGAGAAG 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I hi I I I I I 

Af 12 5521 GT GAGC GAGCC CC GGCAGC C C CAGGAGC C C C GGC GT GT GCAGCT GGGCAGT GT GGAGAAG 

1450 1460 1470 1480 1490 1500 

1510 1520 1530 1540 1550 1560 

Hn5 4 0-1 . Dna T C C GGGAGC ACTT T CT C C C GC GAGCT GGT GTT GAT CAT AGGT C CGC CGGAC AAC C GAGC C 
I I I I I I I I I I I I II ! I I I II I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M 
Af 125521 TCCGGGAGCACTTTCTCCCGCGAGCTGGTGTTGATCATAGGTCCGCCGGACAACCGAGCC 

1510 1520 1530 1540 1550 1560 

1570 1580 1590 1600 1610 1620 

Hn54 0-1 . Dna AAGTTCTCCTGCAAGGCGGGTCAGCTCAGTGCGTCTACGCAGCTGGTGGTGCAGTTCCCC 
I I I I I I I I II I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I 1 I I I 
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^ ^[EDITOR- [540-4. LOG] j 

^^WF C CT GCAAGGC GGGT CAGCT CAGT GC GT C T^^TC£ 



Afl25521 AAGl'Ri C CT GCAAGGC GGGT CAGCT CAGT GC GT C TJ^C AGCT GGT GGT GC AGT T C C C C 

1570 '1580 1590 1600 1610 1620 



1630 1640 1650 1660 167 0 168 0 

Hn540-1 . Dna CCAACCAACCTGACCATCCTGGCCAACTCGTCCGCGCTGCGCCCAGGCGACGCCTTGAAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I i M I I 

Af 125 521 CCAACCAACCTGACCATCCTGGCCAACTCGTCCGCGCTGCGCCCAGGCGACGCCTTGAAC 

1630 1640 1650 1660 167 0 168 0 



1690 1700 1710 1720 1730 1740 

Hn54 0-1 . Dna T T GAC C T GC GT C AGC AT C AGCAGCAAC C C C C C AGT C AAC T T GT C T T GGGACAAGGAAGGA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I 

Af 12 5521 TTGACCTGCGT CAGCATCAGC AGC AAC CCCC CAGT CAACTTGTCTT GGGACAAGGAAGGA 

1690 1700 1710 1720 1730 1740 

1750 1760 1770 1780 1790 1800 

Hn5 4 0- 1 . Dna GAGAGGCT GGAAGAT GT GGCT GCAAAAC CC CAGAGT GCAC CGT T CAAAGGCT C C GCTGC A 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I ! I I I I I I I I I I I I I I I I I 
Af 12 5521 GAGAGGCT GGAAGAT GT GGCT GCAAAAC CCCAGAGT GCAC CGTT CAAAGGCT CCGCTGC A 

17 50 17 60 1770 1780 1790 1800 



1810 1820 1830 1840 1850 1860 

Hn540-1 . Dna T C C AGGAGT GT TT T T C T CAGAGT GT CAT C C C GAGAC C AC GGT C AAC GGGT C AC CT GC C GG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I 

Af 12 5521 T C C AGGAGT GTT T T T C T CAGAGT GT CAT C C C GAGAC C AC GGT C AAC GGGT C AC C T GC C GG 

1810 1820 1830 1840 1850 1860 



1870 1880 1890 1900 1910 1920 

Hn540-1 . Dna GCCCACAGCGAGGCACTCCGTGAAACCGTGAGCTCCTTCTACCGCTTCAATGTGCTGTAT 
I I I I I I I I I I I I I I I I I I I i I II M I I I ! I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I 

Af 12 5521 GCCCACAGCGAGGCACTCCGTGAAACCGTGAGCTCCTTCTACCGCTTCAATGTGCTGTAT 

1870 1880 1890 1900 1910 1920 

1930 1940 1950 1960 1970 1980 

Hn540-1 . Dna C CT C CAGAATT CCT GGGGGAGCAAGT CCGGGC AGT GAC CGT GGT GGAGCAGGGC C AGGT G 
I I I j ! I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Af 125521- CCT CCAGAATT CCT GGGGGAGCAAGT CCGGGCAGT GAC CGT GGT GGAGCAGGGC CAGGTG 

1930 1940 1950 1960 1970 1980 

1990 2000 2010 2020 2030 2040 

Hn540-1 . Dna CTGCTGCCGGT GTCGGTGTCCGCTAACCCCGCCCCCGAGGCCTTCAACTGGACCTTCCGA 

I I I I I I I I I I ! I I I I I I I I i I I I I 1 I I I I 1 I I 11 I 'l I II I I I I I I I I I I I I I I I I I I I I I 

Af 12 5521 CTGCTGCCGGT GTCGGTGTCCGCTAACCCCGCCCCCGAGGCCTTCAACTGGACCTTCCGA 

1990 2000 2010 2020 2030 2040 



2050 2060 2070 2080 2090 2100 

Hn540-1 . Dna GGCTACCGCCTCAGCCCAGCTGGGGGTCCCCGGCACCGTATCCTGTCTGGAGGGGCTCTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I M I i I I I I I I I I I I I I I I I I I I I 
Af 12 5521 GGCTACCGCCTCAGCC CAGCT GGGGGTCCCCGGCAC CGT AT CCTGTCTGGAGGGGCTCTG 

2050 2060 2070 2080 2090 2100 

2110 2120 2130 2140 2150 ' 2160 

Hn540 - 1 . Dna CAGCT GTGGAATGT GAC CCGAGCT GAC GAT GGCTTTT AT CAGCT GCACTGCCAGAACTCA 
I I I I I I I I I I I I I I J I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Af 12 552 1 CAGCT GTGGAATGT GAC CCGAGCT GAC GAT GGCTTT TAT CAGCT GCACTGCCAGAACTCA 

2110 2120 2130 2140 2150 2160 

2170 2180 2190 2200 2210 2220 

Hn5 4 0- 1 . Dna GAGGGCACCGCTGAGGCGCTGTTGAAGCTGGACGTGCATTATGCTCCCACCATCCGTGCC 

I I I I I I I I I 1 I I I I I I II I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Af 12 5521 GAGGGCACCGCTGAGGCGCTGTTGAAGCTGGACGTGCATTATGCTCCCACCATCCGTGCC 

2170 2180 2190 2200 2210 s 2220 



/ 
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T230 2240 2250 2270 2280 

Hn540-1 . Dna CT CC GGGACCCT ACT GAGGT GAAT GTT GGGGGT T CT GT GGACAT AGT CT GCACC GTT GAC 

I I I I I I I 1 I I i I I 1 1 I I I I M I I I M I t 1 I I i I I I I I I I I I I I 1 I I I M I I I I I I I I i I I 

Af 125521 CT C C GGGAC C CTACT GAGGT GAAT GTT GGGGGT TCTGTGGACATAGTCT GCACC GTT GAC 

2230 2240 2250 2260 2270 2280 



2290 2300 2310 2320 2330 2340 

Hn540-1 . Dna GCCAATCC CAT CCT CCCAGAGAT GTT CAGCT GGGAGAGACT GGGAGAAGAAGAGGAGGAT 
I I | I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I l I I M I ! I I I I I I I I I i I I I 
Af 12 552 1 GC CAAT C C CAT C CT C C C AGAGAT GT T C AGC T GGGAGAGACT GGGAGAAGAAGAGGAGGAT 

2290 2300 2310 2320 2330 2340 

2350 2360 2370 2380 2390 2400 

Hn54 0-1 . Dna CTGAACCTGGACGACATGGAGAAAGTTTCCAAGGGATCCACGGGGCGTCTGCGGATTCGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I ! ! M I I I I II I I I I 
Af 12 5521 CT GAAC CT GGAC GAC AT GGAGAAAGT T T C CAAGGGAT C C AC GGGGC GT C T GC GGAT T C GC 

2350 2360 2370 2380 2390 2400 

2410 2420 2430 2440 2450 2460 

Hn540-1 . Dna CAAGCCAAGCTATCCCAGGCTGGTGCCTACCAGTGCATCGTGGACAATGGGGTGGCTCCT 

I I I j I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! ! I I I ! I I I I I I I I I I I 

Af 12 5521 CAAGCCAAGCTATCCCAGGCTGGTGCCTACCAGTGCATCGTGGACAATGGGGTGGCTCCT 

2410 2420 2430 2440 2450 2460 



2470 2480 2490 2500 2510 2520 

Hn540 - 1 . Dna GCAGCCAGAGGACTGGTTCGTCTTGTCGTCCGATTTGCTCCCCAGGTGGATCAGCCTACT 

I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I 1 I I I I I I I I I M I I I I I I I I I I I I I I I I 

Af 12 5521 GC AGC C AG AGGAC T GGT T C GT C T T GT C GT C C GAT T T GCT C C C C AGGT GGAT C AGC CT AC T 

2470 2480 2490 2500 2510 2520 

2530 2540 2550 2560 2570 2580 

Hn5 40-1 . Dna CCCCTAACAAAAGTGGCTGCCGCTGGGGACAGCACCAGCTCAGCCACACTGCACTGCCGT 



I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I i I I I I I I I I I I 1 I I I I I I I I I 
Af 12 5521 CCCCTAACAAAAGTGGCTGCCGCTGGGGACAGCACCAGCTCAGCCACACTGCACTGCCGT 

2530 2540 2550 2560 2570 2580 



2590 2600 261Q 2620 2630 2640 

Hn5 4 0-1 . Dna GCCCGGGGTGTCCCCAACATCGACTTCACTTGGACCAAAAACGGGGTCCCTCTGGATCTC 
I I I I I I I I I II I I I I I I I I I i I I I I I I I I I I I I I I I I I I I II ! I I I I I I I I I I I I I I I I I 
A.f 12 5521 GC CC GGGGT GTCC CC AACATCGACTTCACTTGGACCAAAAACGGGGTCCCTCTGGATCTC 

2590 2600 2610 2620 2630 2640 

2650 2660 2670 2680 2690 2700 

Hn540- 1 . Dna CAAGACCCCAGGTACACAGAGCACAGGTACCACCAGGGTGTTGTCCACAGCAGCCTCTTG 
I I I I I I I I 1 I i I I I I I II I I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I 1 I I I I I I I 
Af 1 2 5 5 2 1 CAAGAC C C C AGGT AC AC AGAGC AC AGGT ACCACC AGGGT GTT GT C CACAGCAGC CT CTT G 

2650 2660 2670 2680 2690 2700 

2710 2720 2730 2740 2750 2760 

Hn540-1 . Dna ACCATCGCTAATGTGTCTGCGGCCCAGGACTATGCCCTCTTCAAATGCACGGCCACCAAT 

I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I M II I I I I II I I I I I I I I I I 

Af 1255 21 ACCATCGCTAATGTGTCTGCGGCCCAGGACTATGCCCTCTTCAAATGCACGGCCACCAAT 

2710 2720 2730 2740 2750 2760 



2770 2780 2790 2800 2810 2820 

Hn540-1 . Dna GCCCTTGGCTCTGACCACACCAACATCCAGCTCGTCAGCATCAGCCGCCCTGACCCTCCA 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Af 12 5521 GCCCTTGGCTCTGACCACACCAACATCCAGCTCGTCAGCATCAGCCGCCCTGACCCTCCA 

2770 2780 2790 2800 2810 2820 

2830 2840 2850 2860 2870 2880 

Hn540-1 . Dna CTGGGACTGAAGGTTGTCAGCATAAGCCCTCACTCGGTGGGGCTGGAGTGGAAGCCTGGC 
I I I I I I I I I I I I I ! I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Af 125521 CT GGGAC TGAAGGTTGT CAGCATA-AGCCCTCACTCGGTGGGGCTGGAGT GGAAGCCTGGC 
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830 2840 2850 2870 28S0 

2890 2900 2910 2920 2930 2940 

Hn54 0-1 . Dna TT T GAT GGGGGT C T GC CT C AGAGGTT C CAAAT C AGGT AC GAGGCC C T C GAGAC C C C AGGA 

I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I 

Af 12 5521 TTT GAT GGGGGT CTGCCTCAGAGGTTCCAAATC AGGT ACGAGGCCCTCGAGACCCC AGGA 

2890 2900 2910 2920 2930 2940 

2950 2960 2970 2980 2990 3000 

Hn540-1 . Dna TTCCTCCACGTGGATGTCCTACCTACACAGGCCACTACCTTCACGCTGACTGGGCTGAAG 

I || I I I I I I I I I I I I I i I I I I I i i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Af 12 5521 T T C CT C C AC GT GGAT GT C CT AC CT AC AC AGGC C ACT AC CT T C AC GC T GAC T GGGC T GAAG 

2950 2960 2970 2980 2990 3000 



3010 3020 3030 3040 3050 3060 

Hn54 0-1 . Dna CCTTCTACACGATATAGGATCTGGCTGTTGGCCAGCAATGCCCTGGGGGACAGTGGATTG 

I I I 1 I I I I I I I I I I I I I I I I I I \ I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I 

Af 12 5521 CCTTCTACACGATATAGGATCTGGCTGTTGGCCAGCAATGCCCTGGGGGACAGTGGATTG 

3010 3020 3030 3040 3050 3060 

3070 3080 3090 3100 3110 3120 

Hn540-1 . Dna ACGGACAAGGGGATCCAGGTCTCCGTCACTACCCCAGGCCCCGACCAGGCTCCTGAAGAC 



I I I 1 I I I I 1 I I I i I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Af 12 5521 ACGGACAAGGGGATCCAGGTCTCCGTCACTACCCCAGGCCCCGACCAGGCTCCTGAAGAC 

3070 3080 3090 3100 3110 3120 



3130 3140 3150 3160 3170 3180 

Hn540-1 . Dna . ACAGACCACCAGCTGCCCACAGAGCTGCCTCCAGGACCCCCAAGGCTGCCCCTGCTGCCT 
I 1. 1 I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Af 12 5 521 ACAGACCACCAGCTGCCCACAGAGCTGCCTCCAGGACCCCCAAGGCTGCCCCTGCTGCCT 

3130 3140 3150 3160 3170 3180 



3190 3200 3210 3220 3230 3240 

Kn54 0-1 . Dna GTGCTCTTTGCAGTTGGTGGTCTT'CTGCTGCTCTCCAATGCCTCCTGTGTTGGGGGTCTC 
I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Af 12 5521 GTGCTCTTTGCAGTTGGTGGTCTTCTGCTGCTCTCCAATGCCTCCTGTGTTGGGGGTCTC 

3190 3200 3210 3220 3230 3240 



3250 3260 3270 3280 3290 3300 

Hn540-1 . Dna CT CT GGCGGAGAAGACT GAGGC GC CTTGCT GAGGAGAT CT CAGAGAAGACAGAGGC AGGG 

I I I I I I I \ I I I I I I I I I I I I I I I I I I I I I I I M I M M I I I II I I I II I I I I ! I I! I I I I 

Af 12 5 52 1 CT C T GGC GGAGAAGAC T GAGGC G C CT T GCT GAGGAGAT C T CAGAGAAGACAGAGGC AGGG 

3250 3260 3270 3280 3290 3300 



3310 3320 3330 3340 3350 3360 

Hn540- 1 . Dna T C GGAGGAC AGGAT C AGGAAT GAAT AT GAGGAGAGT C AGT GGAC T GGGGAC C GGGAC AC G 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I ! I II I I I I 
Af 12 552 1 T CGGAGGAC AGGAT CAGGAAT GAAT AT GAGGAGAGT CAGT GGACT GGGGAC C GGGACAC G 

3310 3320 3330 3340 3350 3360 



3370 3380 3390 3400 3410 3420 

Hn5 4 0 - 1 . Dna AGAAGCTCCACGGTTAGCACAGCAGAAGTGGACCCAAATTACTACTCCATGAGGGACTTC 

I M I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I | | I I I | I || I I I I I I I I I I I I I I I I I | I 

Af 1 2 5 52 1 AGAAGCTCCACGGTTAGCACAGCAGAAGTGGACCCAAATTACTACTCCATGAGGGACTTC 



3370 3380 3390 3400 3410 3420 

3430 3440 3450 3460 3470 3480 

Hn5 4 0-1 . Dna AGCC CC C AGCTT C C C C CAACACT GGAGGAGGT GCT GT AT CAC CAAGGT GCT GAAGGC GAG 
I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I II I I I I II I I ! I I I I I I I I I I I I 
Af 12 5521 AGCCCCCAGCTTCCCCCAACACTGGAGGAGGTGCTGTATCAC CAAGGT GCTGAAGGCGAG 

3430 3440 3450 3460 3470 3480 

. 3490 3500 3510 3520 .3530 3540 

Hn540-1 . Dna GAC AT GGC CT T C C C C GGAC AC C T GC AT GAT GAAGT GGAGAGAGC C TAT GGC C C GC C T GGG 
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1 1 iiwi 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i i 1 1 1 1 wri 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 

Af 125521 GACAT GGC CT T C C C C GGAC AC CT GCAT GAT GAAGT GGAGAGAGC CT AT GGC C C GC CT GGG 

3490 3500 3510 3520 3530 3540 

3550 3560 3570 3580 35S0 3600 

Hn540-1 . Dna GC CT GGGGAC C C CT CTAT GAT GAAGTACGAAT GGAC CCCTATGACCTTCGCT GGC CT GAG 
I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Af 12 5521 GC C T GGGGAC C C C T CTAT GAT GAAGT AC GAAT GGAC C C CT AT GAC C T T CGCT GGCCT GAG 

3550 3560 3570 3580 3590 3600 

3610 3620 3630 3640 3650 3660 

Hn540-1 . Dna GT C CAAT GT GAGGAT C C GAGGGGAAT CT AC AAC CAGGT GGC AGC AGAC AT GGAT GCT GT G 

I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Afl25521 GTC CAAT GT GAGGAT C C GAGGGGAAT CT ACAAC CAGGT GGCAGC AGACAT GGAT GCT GT G 

3610 3620 3630 3640 3650 3660 

3670 3680 3690 3700 

Hn5 4 0-1 . Dna GAAGCTAGCTCTCTGCCGTTTGAGCTGAGGGGACATCTGGT GTGA 
I I I I I I I 1 I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I 
Af 12 5521 GAAGCTAGCTCTCTGCCGTTTGAGCTGAGGGGACATCTGGTGTGA 

3670 3680 3690 3700 

Hn540-l.Dna 
EmrodiAf 161715 

ID AF161715 standard; RNA; ROD; 5820 BP. 
AC AF161715; 
SV AF161715.1 

DT 12-DEC-1999 (Rel. 62, Created) 

DT 12-DEC-1999 (Rel. 62, Last updated, Version 1) 
DE Rattus norvegicus nephrin mRNA, complete cds . 
KW 

OS Rattus norvegicus (Norway rat) 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; Mammalia; 

OC Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Rattus. 

RN [1]. 

RP 1-5820 

RA Kawachi H., Koike H., Yaoita E . , Yamamoto T., Orikasa M. , Shimizu F.; 

RT "Cloning of rat nephrin and its expression and localization in proteinuric 

RT states"; 

RL Unpublished. 

RN [2] 

RP 1-5820 

RA Kawachi H., Koike H., Yaoita E., Yamamoto T., Orikasa M. , Shimizu F.; 
RT 

RL Submitted (22-JUN-1999) to the EMBL/GenBank/DDB J databases. 

RL Department of Cell Biology, Institute of Nephrology, Niigata University 

RL School of Medicine, 1-757 Asahimachi-dori , Niigata 951-8510, Japan 

DR' SPTREMBL; Q9QXX7; Q9QXX7 . 

FH Key Location/Qualifiers 

FH : 

FT source 1 . . 5820 

FT /db_xref="taxon: 10116" 

FT /organism="Rattus norvegicus" 

FT /strain="Wistar" 

FT /tissue_type="glomeruli " 

FT CDS • 404. .4162 

FT /codon_start=l 

FT /db__xref =" SPTREMBL : Q9QXX7 " 

FT /product="nephrin" 

FT /protein_id="AAF14884 . 1 " 

FT- /translati on= "MGAKRVTVRGARTS P I HRT S S LT P L LLMGMLT S GLAE S PV FT SAP 
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FT QGFWALSENLTAVEGTTVKLWCGVRAPO^^^WAKDGLLLGPNPKMPGFPRYSLEGDR 

FT KGE FHLLI EACDLSDDAE YE CQVGRSE LGPE LVS PKVI LS I LVS PKVLLLTPEAGSTVT 

FT WVAGQEYWTCVSGDAKPAPDITFIQSGRTILDVSSNVNEGSEEKLCITEAEARVIPQS 

FT SDNGQLLVCEGSNPALDTPIKASFTMNILFPPGPPVIDWPGLNEGHVRAGENLELPCTA 

FT RGGNPPATLQWLKNGKPVSTAWGTEHAQAVAHSVLVMTVRPEDHGARLSCQSYNSVSAG 

FT TQERSITLQVTFPPSAITILGSVSQSENKNVTLCCLTKSSRPRVLLRVTV7LGGRQLLPTD 

FT ETVMDGLHGGHISMSNLTFLVRREDNGLPLTCEAFSDAFSKETFKKSLTLNVKYPAQKL 

FT WIEGPPEGQYIRTGTRVRLVCLAIGGNPDPSLIWFKDSRPVSEPRQPQEPRRVQLGSVE 

FT KSGSTFSRELVLIIGPPDNRAKFSCKAGQLSASTQLWQFPPTNLTILANSSALRPGDA 

FT LNLTCVSISSNPPVNLSWDKEGERLEDVAAKPQSAPFKGSAASRSVFLRVSSRDHGQRV 

FT TCRAHSEALRETVSSFYRFNVLYPPEFLGEQVRAVTWEQGQVLLPVSVSANPAPEAFN 

FT WTFRGYRLS PAGGPRHRILSGGALQLWNVTRADDGFYQLHCQNSEGTAEALLKLDVHYA 

FT 

PTIRALRDPTEVNVGGSVDIVCTVDANPI LPEMFSV7ERLGEEEEDLNLDDMEKVSKGST 

SCORES Initl: 18452 Initn: 18452 Opt: 18453 z-score: 25893.3 E{): 0 



99.8% identity in 3705 bp overlap 

10 20 30 

ATGTCCAGTTTGACTCCCCTGCTGCTCATG 
I I I I I I I I I I I i I I I I I I I I I I I I I I I I I 
AGAGGTGCCCGGACAAGCCCAATACACAGAACGTCCAGTTTGACTCCCCTGCTGCTCATG 
430 440" 450 460 470 480 

40 50 60 70 80 90 

GGAATGCTGACCTCAGGCCTGGCCGAGTCGCCAGTCCCCACCTCAGCA.CCTCGAGGCTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I f I I I I I I I I I ! II I I ! I I I I I I I I I I I I I I I 

GGAATGCTGACCTCAGGCCTGGCCGAGTCGCCAGTCCCCACCTCAGCACCTCAAGGCTTC 
490 500 510' 520 530 540 



Hn540-l.Dna 
Af 161715 

Hn540-1 . Dna 
Afl61715 



100 110 120 130 140 150 

Hn540-1 . Dna TGGGCTCTGTCTGAAAACCTGA.CTGCGGTGGAAGGGACAACAGTTAAGCTATGGTGCGGT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I ! I I I i I I I I I ! I I I I I 

Af 161715 TGGGCTCTGTCTGAAAACCTGACTGCGGTGGAAGGGACAACAGTTAAGCTATGGTGCGGT 
550 560 570 580 590 600 



160 170 180 190 200 210 

Hn54 0-1 . Dna GTCAGGGCCCCTGGCAGTGTGGTGCAGTGGGCTAAGGATGGGCTGCTTCTGGGTCCAAAC 

II I I I I I I I I I I i I I I I I I I I I I I i I I I I I i I I I I I I I I I I I I I I I I I I I I I I I i I I I I I 

Afl61715 GT CAGGGC C CCTGGCAGT GT GGT GCAGT GGGCT AAGGAT GGGCTGCTTCTGGGTC CAAAC 

610 620 630 640 650 660 

220 230 240 250 260 270 

Hn540-1 . Dna C C GAAGAT GC C AGGC T T C C C GAGGT AC AGC C T GGAAGGAGAT C GT GC TAAAGGC GAGT T C 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I 
Af 1 6 1 7 1 5 C C GAAGAT GCCAGGCTT C C C GAGGT AC AGC CT GGAAGGAGAT CGTGCTAAAGGC GAGTT C 

670 680 690 700 710 720 



280 290 300 310 320 330 

Hn5 4 0-1 . Dna C AC CT GCT T ATT GAAGC CT GT GAC CT CAGTGAT GAC GCAGAGTAT GAAT GC CAAGT CGGC 
I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Af 1 617 15 CAC CT GCT TAT T GAAGC CT GT GAC CT CAGT GAT GAC GCAGAGTAT GAAT GC CAAGT C GGC 
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730^^ 740 750 760 ^^770 780 

340 350 360 370 380 390 

Hn540-1 . Dna CGCTCAGAGTTGGGTCCCGAGCTTGTGTCTCCTAAAGTAATCCTCTCCATTCTAGTTTCC 

I | | | | | I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II II I I I I I I I I M M II I I I 
Af 161715 CGCTCAGAGTTGGGTCCCGAGCTTGT GTCTCCTAAAGTAATCCTCTCCATTCTAGTTTCC 

790 800 810 820 830 840 

400 410 420 430 440 450 

Hn540-1 . Dna CCCAAGGTGCTTCTGTTGACCCCCGAGGCAGGAAGCACAGTGACCTGGGTAGCTGGGCAG 

I I I I I I I I I I I I I I II I I I I I I I I M I I I M I I I I I I I I I 11 I I I M I i I I 1 I I I I I I I I 

Af 161715 CCCAAGGTGCTTCTGTTGACCCCCGAGGCAGGAAGCACAGTGACCTGGGTAGCTGGGCAG 
850 860 870 880 890 900 

460 470 480 490 500 510 

Hn540-1 . Dna GAGT AT GT GGT C AC CT GT GT GT C T GGGGAT GCAAAAC C AGC AC C T GAC AT C AC C T T CAT C 
I I M M I I I II I I I I I I I I 1 I I I i I I I M I I I I I I I I I I I I I I I I 1 I I I I M I I I I I I I 

Afl61715 GAGT AT GT GGT C AC C T GT GT GT C T GGAGAT GCAAAAC C AGC AC C T GAC AT C AC CT T CAT C 

910 920 930 940 950 960 

520 530 540 550 560 570 

Hn540-1 . Dna CAGAGT GGACGAACTATATTGGACGTCT CCTCCAAT GTGAATGAGGGAT CAGAGGAGAAA 
I | 1 | I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Af 1 6 1 7 1 5 CAGAGT GGAC GAACT AT ATTGGACGT CT CCT CCAAT GT GAATGAGGGAT CAGAGGAGAAA 

970 980 990 1000 1010 1020 

580 590 600 610 620 630 

Hn540-1 . Dna CT CT GC AT C ACAGAGGC C GAAGCCAGGGT GAT AC C CC AGAGCT C GGATAACGGGC AGTT A 

I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I M I I I I I I I I I i I I I I I I I I I I I I I I I 

Af 1 6 17 1 5 CTCTGCATCACAGAGGCCGAAGCCAGGGTGATACCCCAGAGCTC GGATAACGGGC AGTT A 

1030 1040 1050 1060 1070 1080 



640 650 660 670 680 690 

Hn540-1 . Dna CTGGTCTGTGAGGGTTCCAACCCAGCTTTGGACACTCCCATAAAGGCTTCATTCACCATG 
I I I I I I M II I I II I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Af 161715 CTGGTCTGTGAGGGTTCCAACCCAGCTTTGGACACTCCCATAAAGGCTTCATTCACCATG 
1090 1100 1110 1120 1130 1140 

700 710 720 730 740 750 

Hn540-1 . Dna AAT AT T CT GT T T C C C C C AGGACC T CCT GT CAT T GAT T GGC C AGGC C T GAAT GAAGGGC AT 
I I II I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II 

Af 1 6 1 7 1 5 AATATTCTGTTTCCCCCAGGA.CCT CCT GTCATT.GATT GGC CAGGCCT GAAT GAGGGGCAT 

1150 1160 1170 1180 1190 1200 

760 770 780 790 800 810 

Hn5 4 0-1 . Dna GT GAGGGC AGGGGAGAACCT GGAGCT GC C CT GC AC AGC C AGAGGT GGC AAT CC AC CT GCT 
I I I I I I I I I I I I I I I M I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Af 1 6 1 7 1 5 GTGAGGGCAGGGGAGAACCT GGAGCT GC CCT GCACAGCCAGAGGTGGCAAT CCACCT GCT 

1210 1220 1230 1240 1250 1260 

820 830 840 850 860 870 

Hn54 0-1 . Dna ACCCTGCAGTGGCTGAAGAACGGTAAACCAGT GTCCACAGCCTGGGGCACCGAGCATGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Af 161715 AC CCTGCAGTGGCTGAAGAACGGTAAACCAGT GTCCACAGCCTGGGGCACCGAGCATGCC 

1270 1280 1290 1300 1310 1320 

880 890 900 910 ' 920 . S30 

Hn540-1 . Dna C AGGC AGT GGC C C AC AGT GT GCT GGT GAT GACT GT AC GAC CT GAA.GAC CAT GGAGCT CGG 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Af 161715 C AGGC AGT G GCC C AC AGC GT GCT GGT GAT GACT GT AC GAC CT GAAGAC CAT GGAGCT CGG 

1330 1340 1350 1360 1370 1380 

940 950 960 970 980 S90 

Hn540-1 . Dna CTCAGCTGTCAGTCCTACAACAGCGTGTCTGCAGGGACCCAGGAGAGAAGCATCACACTA 
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I I I IWI I I I I I I I I I I I i I I I I I I I 1 I I I I I I I I IWI I I I I I I I I I I I I I I ! I I I I 

Af 1 6 1 7 1 5 CT C AGCT GT CAGT CCT AC AACAGCGTGT CT GC AGGGACCC AGGAGAGAAGCAT CACACTA 

1390 1400 1410 1420 1430 1440 

1000 1010 1020 1030 1040 1050 

Hn540-1 . Dna G AGGT C AC CTTTCCCC CAAGC GC C AT T AC CAT C CT GGGAT CT GT AT C ACAAT C GGAGAAC 

I I I li I I I I I I I I I I I I I I I I I i I I I I I I I I II I I I 1 I I I I I I I I I I I I I I I I I I I I I I I 

Af 161715 CAG GT C AC CTTT C C C C CAAGC GC CAT T AC CAT C CT GGGAT CT GT AT C ACAAT C GGAGAAC 

1450 1460 1470 1480 1490 1500 

1060 1070 1080 1090 1100 1110 

Hn540-1 . Dna AAGAACGTGACCCTTTGCTGCCTGACCAAGTCCAGTCGCCCACGGGTCCTGCTGCGATGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 1 I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Af 161715 AAGAACGTGACCCTTTGCTGCCTGACCAAGTCCAGTCGCCCACGGGTCCTGCTGCGATGG 
1510 1520 1530 1540 1550 1560 

1120 1130 1140 1150 1160 1170 

Hn540-1 . Dna T GGT T GGGT GGAC GGC AGCT GCT GC C CACAGAT GAGACAGT CAT GGAT GGCCT GCAT GGT 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I ! I ! I I I I I I I i I I I I I I I I I I I I I I I I I I I I 

Af 161715 T GGT T GGGT GGACGGC AGCT GCT GCC CACAGAT GAGACAGT CAT GGAT GGCCT GCAT GGT 

1570 1580 1590 1600 1610 1620 



1180 1190 1200 1210 1220 1230 

Hn5 4 0-1 . Dna GGC CACAT CT CCATGT CCAAT CT CACATT CTT GGT GC GGAGAGAAGACAAT GGC CTGCC C 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I 
Af 161715 GGC CACAT CTCC AT GTCCAATCTCACATTCTT GGT GCGGAGAGAAGACAAT GGC CTGCCC 

1630 1640 1650 1660 1670 1680 

1240 1250 1260 1270 1280 1290 

Hn540-1 . Dna CTCACGTGTGAAGCCTTCAGTGACGCCTTCAGCAAGGAGACCTTCAAGAAGT CACTCACC 
MM! I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Af 161715 CTCACCTGTGAAGCCTTCAGTGACGCCTTCAGCAAGGAGACCTTCAAGAAGT CACTCACC 

1690 1700 1710 1720 1730 1740 

1300 1310 1320 1330 1340 1350 

Hn5 4 0-1 . Dna TTGAATGTGAAATACCCTGCCCAGAAGCTGTGGATTGAGGGGCCCCCAGAGGGACAGTAC 
I I I I I I I I I I I I I I I I I I I I! I I I I I I I I :| I I I I I I I I I I I I I ! I I I I I I M I I I I I I I I 
Af 161715 T T GAAT GT GAAAT AC C C T GC C C AGAAGC T GT GGAT T G AGGGGC C C C CAGAGGGAC AGT AC 

1750 1760 1770 1780 1790 1800 

1360 1370 1380 1390 1400 1410 

Hn5 4 0-1 . Dna AT CCGGACTGGGACTCGGGTGAGGCTGGTAT GCT T GGC CAT CGGAGGC AACCCAGACCCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Af 161715 ATCCGGACTGGGACTCGGGTGAGGCTGGTATGCTTGGCCATCGGAGGCAACCCAGACCCC 
1810 1820 1830 1840 1850 1860 

1420 1430 1440 1450 1460 1470 

Hn540- 1 . Dna TCCCTCATCTGGTTTAAGGATTCACGTCCGGTGAGCGAGCCCCGGCAGCCCCAGGAGCCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Af 161715 TCCCTCATCTGGTTTAAGGATTCACGTCCGGTGAGCGAGCCCCGGCAGCCCCAGGAGCCC 
1870 1880 1890 1900 1910 1920 

1480 1490 1500 1510 1520 1530 

Hn540-1 . Dna CGGCGTGTGCAGCTGGGCAGTGTGGAGAAGTCCGGGAGCACTTTCTCCCGCGAGCTGGTG 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I 
Af 161715 C GG C GTGTGC AGCT GGGC AGT GTGGAGAAGTCCGGGAGCACTTTCTCCCGCGAGCTGGTG 

1930 1940 1950 1960 1970 1980 

1540 1550 1560 1570 1580 1590 

Hn540-1 . Dna TT GAT CATAGGTCCGCCGGACAACCGAGCCAAGTTCTCCTGCAAGGC GGGT CAGCTCAGT 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Af 161715 T T GAT CAT AGGT C C GC C GGAC AAC C GAGC C AAGT T C T C C T GC AAGGC GGGT C AGCT C AGT 

1990 2000 2010 2020 2030 2040 
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1640 1650 



Hn5 40-1 . Dna GCGTCTACGCAGCTGGTGGTGCAGTTCCCCCCAACCAACCTGACCATCCTGGCCAACTCG 
I | | 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I i I I M I I I I I I I I 
Af 1 6 1 7 1 5 GCGTCTACGCAGCTGGTGGT GCAGTTCCCCCCAACCAACCTGACCATCCTGGCCAACTCG 

2050 2060 2070 2080 2090 2100 

1660 1670 1680 ■ 1690 1700 1710 

Hn540- 1 . Dna TCCGCGCTGCGCCCAGGCGACGCCTTGAACTTGACCTGCGT CAGCATCAGCAGCAACCCC 
I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Af 161715 TCCGCGCTGCGCCCAGGCGACGCCTTGAACTTGACCTGCGT CAGCATCAGCAGCAACCCC 

2110 2120 2130 2140 2150 2160 



1720 1730 1740 1750 1760 1770 

Hn5 4 0- 1 . Dna CCAGT CAACT T GT CTT GGGACAAGGAAGGAGAGAGGCT GGAAGAT GT GGCT GCAAAAC CC 
I I I I I I I I I I I I I I I I I I I I I I I I 1 I I t II I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I 
Af 1 6 1 7 1 5 CCAGT CAACTTGT CTT GGGACAAGGAAGGAGAGAGGCT GGAAGAT GT GGCT GCAAAACCC 

2170 2180 2190 2200 2210 2220 

1780 1790 1800 1810 1820 1830 

Kn540- 1 . Dna CAGAGTGCACCGTTCAAAGGCTCCGCTGCATCCAGGAGTGTTTTTCTCAGAGTGTCATCC 
I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Af 161715 CAGAGT GC AC C GT T CAAAGGCT C C GC T GC AT C C AGGAGT GT T T T T C T C AGAGT GT CAT C C 

2230 2240 2250 2260 2270 2280 

1840 1850 1860 1870 1880 1890 

Hn5 40-1 . Dna CGAGAC CAC GGT CAACGGGT C ACCT GC CGGGCC CACAGC GAGGCACT C CGT GAAACCGT G 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Af 1 6 1 7 1 5 CGAGAC CAC GGT CAACGGGT CAC CTGC CGGGCC CACAGC GAGGCACT CCGTGAAACCGTG 

2290 2300 2310 2320 2330 2340 

1900 1910 1920 1930 1940 1950 

Hn540-1 . Dna AGCT C CT T CT AC C GCTT C AATGT GCT GT AT C CT C CAGAATT C CT GGGGGAGCAAGT C C GG 

I I I I I I I II I I I I II I I I I I I I I I I I I I I I I 1 I I I I I 1 I I I I I I I i I I i I I I I I I I I I I I 

Af 161715 AGCTCCTTCTACCGCTTCAATGTGCTGTATCCTCCAGAATTCCTGGGGGAGCAAGTCCGG 
2350 2360 2370 2380 2390 2400 

1960 1970 1980 1990 2000 2010 

Hn540-1 . Dna GCAGTGACCGTGGTGGAGCAGGGCCAGGTGCTGCTGCCGGT GTCGGTGTCCGCTAACCCC 
I I I I M I M I I I I I M I I 1 I I I ! i I I I I i 1 I I I I I i I I I I I I I I I I I I I I i ! I I I I I I I i 

Af 161715 GCAGTGACCGT GGTGGAGCAGGGCCAGGTGCTGCTGCCGGTGTCGGT GTCCGCTAACCCC 

2410 2420 2430 2440 2450 2460 

2020 2030 2040 2050 2060 2070 

Hn540-1 . Dna GCCCCCGAGGCCTTCAACTGGACCTTCCGAGGCTACCGCCTCAGCCCAGCTGGGGGTCCC 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I 

Af 161715 GCCCCCGAGGCCTTCAACTGGACCTTCCGAGGCTACCGCCTCAGCCCAGCTGGGGGTCCC 
2470 2480 2490 2500 2510 2520 

2080 2090 2100 2110 2120 2130 

CGGCACCGTATCCTGTCTGGAGGGGCTCTGCAGCTGTGGAATGTGACCCGAGCTGACGAT 
! I I I I I I I II II I I II II I II I I I I I I I I I I I II I II I I I I I II I II I I I I I I 11 I I I I I 
CGGCACCGTATCCTGTCTGGAGGGGCTCTGCAGCTGTGGAATGTGACCCGAGCTGACGAT 
2530 2540 2550 2560 2570 2580 

2140 2150 2160 2170 2180 2190 

Hn540-1'. Dna GGCTTTTATCAGCTGCACTGCCAGAACTCAGAGGGCACCGCTGAGGCGCTGTTGAAGCTG 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! II I I I I I I I I I I I I I I I I I I I I I I 

Afl61715 GGCTTTTATCAGCTGCACTGCCAGAACTCAGAGGGCACCGCTGAGGCGCTGTTGAAGCTG 
2590 2600 2610 2620 2630 2640 

2200 2210 2220 2230 2240 2250 

Hn5 40-1 . Dna GACGTGCATTATGCTCCCACCATCCGTGCCCTCCGGGACCCTACTGAGGTGAATGTTGGG 
I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! ! I I I I I I I I 



Hn540-1 .Dna 
Af 161715 
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Af 161715 GAC1P5CATTATGCTCCCACCATCCGTGCCCTCCG(3WkCCTACTGAGGTGAATGTTGGG 

2650 2660 2670 2680 2690 2700 



2260 2270 2280 2290 2300 2310 

Hn540-1 . Dna GGTTCTGTGGACATAGTCTGCACCGTTGACGCCAATCCCATCCTCCCAGAGATGTTCAGC 

I I I 1 1 1 I 1 1 I 1 1 1 1 1 I i l I l 1 1 1 l i 1 1 l l l 1 1 l 1 1 l 1 1 I l 1 1 1 l l l l 1 1 l I l 1 1 l 1 1 I I I 

Af 161715 GGT T CT GT GGAC AT AGT CT GCAC C GTT GAC GC CAAT C C CAT C C T C C C AGAGAT GT T C AGC 

2710 2720 2730 2740 2750 2760 

2320 2330 2340 2350 2360 2370 

Hn5 4 0- 1 . Dna T GGGAGAGACT G GGAGAAGAAGAGGAGGAT CT GAAC CT GGAC GAC AT GGAGAAAGT T T C C 
I ! I II I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I t I I I I I ! I I I I I II 
Af 1 6 1 7 1 5 T GGGAGAGACT GGGAGAAGAAGAGGAGGAT CT GAAC CT GGAC GAC ATGGAGAAAGTTTCC 

2770 2780 2790 2800 2810 2820 

2380 2390 2400 2410 2420 2430 

Hn5 4 0-1 . Dna AAGGGATCCACGGGGCGTCTGCGGATTCGCCAAGCCAAGCTATCCCAGGCTGGTGCCTAC 
I I I I I I I I I I I I I I I I M I I I I I I I I I I | | | | | | | | | | | M | | | | | | | | | | | | | | | | | | | 
Af 161715 AAGGGATCCACGGGGCGTCTGCGGATTCGCCAAGCCAAGCTATCCCAGGCTGGTGCCTAC 
2830 2840 2850 2860 2870 2880 

2440 2450 2460 2470 2480 2490 

Hn5 4 0-1 . Dna CAGTGCATCGTGGACAATGGGGTGGCTCCTGCAGCCAGAGGACTGGTTCGTCTTGTCGTC 

I I i I I I I I I I I I I I I I I I I I I I I I I II I I I ! I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Af 161715 CAGTGCATCGTGGACAATGGGGTGGCTCCTGCAGCCAGAGGACTGGTTCGTCTTGTCGTC 
28S0 2900 2910 2920 2930 2940 

2500 2510 2520 2530 2540 2550 

CGATTTGCTCCCCAGGTGGATCAGCCTACTCCCCTAACAAAAGTGGCTGCCGCTGGGGAC 
I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGATTTGCTCCCCAGGT GGATCAGCCTACTCCCCTAACAAAAGTGGCTGCCGCTGGGGAC 
2950 2960 2970 2980 2990 3000 

2560 2570 2580 2590 2600 2610 

Hn540-1 . Dna AGCACCAGCTCAGCCACACTGCACTGCCGT GCCCGGGGTGTCCCCAACATCGACTTCACT 

I I I I I I I I I I I i I I I I I I I I i i I I I I I I I H I I I I I I ! I I M I I I I I II I I II I I I I M I 

Af 1 6 1 7 1 5 AGCACCAGCTCAGCCACACTGCACTGCCGTGCCCGGGGTGTCCCCAACATCGACTTCACT 
3010 3020 3030 3040 3050 3060 

2620 2630 2640 2650 2660 2670 

T GGAC CAAAAAC GGGGT C C CT CT GGAT C T C CAAGAC C C CAGGT AC AC AGAGC AC AGGT AC 

I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I ! I II I I i II I I I I I I I I I 

T GGAC C AAAAAC GGGGT CCCTCT GGAT CTCCAAGACCC CAGGT AC AC AGAGC ACAGGT AC 
3070 3080 3090 3100 3110 3120 

2680 2690 2700 2710 2720 2730 

CACCAGGGTGTTGTCCACAGCAGCCTCTTGACCATCGCTAATGT GTCTGCGGCCCAGGAC 
I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
C AC C AGGGT GTT GT C C AC AGC AGC C T C T T GAC CAT C GC T AAT GT GT C T GC GG C C C AGGAC 
3130 3140 3150 3160 3170 3180 

2740 2750 2760 2770 ' 2780 2790 

TATGCCCTCTTCAAATGCACGGCCACCAATGCCCTTGGCTCTGACCACACCAACATCCAG 
I I I I I I I II I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
TAT GCCCTCTTCAAAT GCAC GGCCAC CAAT GCCCTTGGCTCT GAC CACACCAACATCCAG 
3190 3200 3210 3220 3230 3240 



Hn540-1 .Dna 
Af 161715 



Hn540-1 .Dna 
Afl61715 



Hn540-1 .Dna 
Af 161715 



Hn540-1 .Dna 
Af 161715 



2800 2810 2820 2830 2840 2850 

Hn540-1 . Dna CTCGTCAGCATCAGCCGCCCTGACCCTCCACTGGGACTGAAGGTTGTCAGCATAAGCCCT 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Af 1 617 15 CTCGTCAGCATCAGCCGCCCTGACCCTCCACTGGGACTGAAGGTTGTCAGCATAAGCCCT 
3250 3260 3270 3280 3290 3300 
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^/860 2870 2880 ^^P& 2900 

CACTCGGTGGGGCTGGAGTGGAAGCCTGGCTTTGATGGGGGTCTGCCTCAGAGGTTCCAA 

I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I ! I I I I I I I i I I I 
CACTCGGTGGGGCTGGAGTGGAAGCCTGGCTTTGATGGGGGTCTGCCTCAGAGGTTCCAA 



3310 



3320 



3330 



3340 



3350 



3360 



2910 



Hn540-l.Dna 



Af 161715 



2920 2930 2940 2950 2S60 2970 

AT C AGGT AC GAGGC C CT C GAGAC C C C AGGAT T C CT C C AC GT GGAT GT C CT AC CTAC ACAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT C AGGT AC GAGGC C CT C GAGAC C C C AGGAT T C CT C C ACGT GGAT GT C CT AC CT ACAC AG 
3370 3380 3390 3400 3410 3420 



Hn540-1 .Dna 
Af 161715 



2980 2990 3000 3010 3020 3030 

GCCACTACCTTCACGCTGACTGGGCTGAAGCCTTCT ACAC GAT AT AGGAT CTGGCTGTTG 

I I I I I I I I I I I I I II I I I I I I I I I I I I ! i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCCACTACCTTCACGCTGACTGGGCTGAAGCCTT CTAC AC GAT AT AGGAT CTGGCTGTTG 
3430 3440 3450 . 3460 3470 3480 



Hn540-l.Dna 
Af 161715 



3040 3050 3060 3070 3080 3090 

GC C AGCAAT GC C CT GGGGGACAGT GGAT TGACGGACAAGGGGATCC AGGT CTCCGTC ACT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCAGCAATGCCCT GGGGGACAGT GGATTGACGGACAAGGGGATCC AGGT CTCCGT CACT 
3490 3500 3510 3520 3530 3540 



Hn540-1 .Dna 



3100 3110 3120 3130 3140 3150 

ACCCCAGGCCCCGACCAGGCTCCTGAAGACACAGACCACCA.GCTGCCCACAGAGCTGCCT 



I I I I I I I ! I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Af 161715 ACCCCAGGCCCCGACCAGGCTCCTGAAGACACAGACCACCAGCTGCCCACAGAGCTGCCT 
3550 3560 3570 3580 3590 3600 



Kn540-1 .Dna 



Af 161715 



3160 3170 3180 3190 3200 3210 

CCAGGACCCCCAAGGCTGCCCCTGCTGCCTGTGCTCTTTGCAGTTGGTGGTCTTCTGCTG 

I l l l l l l l l l I l I I 1 1 l I I I I I I l l l i l l l l 1 1 I I I i l I l l l l l I I l I 1 1 I l I l l II I I l 

CCAGGACCCCCAAG'GCTGCCCCTGCTGCCTGTGCTCTTTGCAGTTGGTGGTCTTCTGCTG 
3610 3620 3630 3640 3650 3660 



3220 



3230 



3240 



3250 



3260 



3270 



Hn540-1 .Dna 



Af 161715 



CTCTCCAATGCCTCCTGT GTTGGGGGTCTCCTCTGGCGGAGAAGACTGAGGCGCCTTGCT 

I I I I I I I M I i I I I I I I I I i I I I I I I I I 1 I I I I I I I I I I I I I I I J I I I i I I I I I I I I I I I 

CTCTCCAATGCCTCCTGT GTTGGGGGTCTCCTCTGGCGGAGAAGACTGAGGCGCCTTGCT 
3670 3680 3690 3700 3710 3720 



3280 3290 3300 3310 3320 3330 

Hn5 4 0- 1 . Dna GAGGAGAT CT CAGAGAAGAC AGAGGCAGGGT CGGAGGACAGGAT CAGGAAT GAAT AT GAG 
I I i I I 1 I I I I I I ! I ! I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I ! I I I I I I I I I I I I ! I I 
Af 1 6 1 7 1 5 GAGGAGAT C T CAGAGAAGAC AGAGGCAGGGT C GGAGGAC AGGAT CAGGAAT GAAT AT GAG 

3730 3740 3750 3760 3770 3780 



3340 3350 3360 3370 3380 3390 

Hn540- 1 . Dna GAGAGT C AGT GGACT GGGGAC CGGGACACGAGAAGCT CC AC GGTT AGCACAGCAGAAGT G 
I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I ! I I I i I I I I I I I I I I I I 1 I I I T I I M I 

Af 1 6 1 7 1 5 GAGAGT C AGT GGACT GGGGAC C GGGAC AC GAGAAGCT C C AC GGT T AGCACAGCAGAAGT G 

3790 3800 3810 3820 3830 3840 

3400 3410 3420 3430 3440 3450 

Hn540- 1 . Dna GACCCAAATTACTACTCCATGAGGGACTTCAGCCCCCAGCTTCCCCCAACACTGGAGGAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I ! I I I I I I I I I I I I I I I 

Af 161715 GACCCAAATTACTACTCCATGAGGGACTTCAGCCCCCAGCTTCCCCCAACACTGGAGGAG 

3850 3860 3870 3880 3890 3900 

3460 3470 3480 3490 3500 3510 

Hn540-1 . Dna GT GCT GTAT C AC CAAGGT GCTGAAGGCGAGGACAT GGC CTT CC C CGGAC AC CT GCAT GAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
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SBR 1 AT C AC CAAGGT GC T GAAGGC GAGGAC AT (^BR 1 



Af 1 617 1 5 GT G^BR 1 AT C AC CAAGGT GCT GAAGGC GAGGAC AT C^HPr T C C C C GGAC ACCT GCAT GAT 

3910 3920 3930 3940 3950 3960 



3520 3530 3540 3550 3560 3570 

Hn54 0-1 . Dna GAAGT GGAGAGAGCCT AT GGCC C GCCT GGGGCCT GGGGAC C C CT CT AT GAT GAAGT ACGA 
I I I I I I I I I I I I I I I I I I I I I I I I S I I ! I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I 

Af 1 6 1 7 1 5 GAAGT GGAGAGAGC C TAT GGC C C GCCT GGGGCCT GGGGAC CCCTCTAT GAT GAAGT ACGA 

3970 3980 3990 4000 4010 4020 

3580 3590 3600 3610 3620 3630 

Hn5 4 0-1 . Dna ATGGACCCCTATGACCTTCGCTGGCCTGAGGTCCAATGTGAGGATCCGAGGGGAATCTAC 
I ! I I I I ! I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Af 1 6 1 7 1 5 ATGGACCCCTATGACCTTCGCTGGCCTGAGGTCCAGTGTGAGGATCCGAGGGGAAT CTAC 

4030 4040 4050 4060 4070 4080 



3640 3650 3660 3670 3680 3690 

Hn54 0-1 .Dna AACCAGGTGGCAGCAGACATGGATGCTGTGGAAGCTAGCTCTCTGCCGTTTGAGCTGAGG 

I I I I I I I I I I I I I ! I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Af 161715 GACCAGGT GGCAGCAGACATGGATGCTGTGGAAGCTAGCTCTCTGCCGTTTGAGCTGAGG 

4090 4100 4110 4120 4130 4140 

3700 

Hn540-1 . Dna GGACATCTGGTGTGA 
I I I I I I I I I I ! I I I I 

Af 1 6 1 7 1 5 GGAC AT CT GGT GT GAGAC GC T T C AC AAC AC C CGT TT C CT ACAGC CCT GGAGAAGAT GT GA 

4150 4160 4170 4180 4190 4200 



Hn540-l.Dna 
Emrod:Af 168466 

ID AF168466 standard; RNA; ROD; 3729 BP. 



AC AF168466; 

SV AF168466.1 

DT 21-OCT-1999 (Rel. 61, Created) 

DT 21-OCT-1999 (Rel.. 61, Last updated, Version 1) 

DE Mus musculus nephrin (Nphsl) mRNA, complete cds . 
KW 

OS Mus musculus (house mouse) 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; Mammalia; 



OC Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Mus. 

RM [ 1 ] 

RP 1-3729 

RX MEDLINE; 99436348. 

RA Holzman L.B., St John P.L., Kovari I. A., Verma R., Holthofer K., 

RA Abrahamson D.R.; 

RT "Nephrin localizes to the slit pore of the glomerular epithelial cell"; 

RL Kidney Int. 56 ( 4 ): 1481-1491 ( 1999 ) . 

RN [2] 

RP 1-3729 



RA Holzman L.B., St John P.L., Kovari I.A. , Verma R., Holthofer H., 

RA Abrahamson D.R.; 

RT 

RL Submitted ( 12-JUL-1999) to the EMBL/GenBank/DDBJ databases. 

RL Internal Medicine/Nephrology, University of Michigan Medical School, 1560 

RL MSRB II, P.O. Box 0676, Ann Arbor, MI 48109-0676, USA 

DR SPTREMBL; Q9QZS7 ; Q9QZS7 . 



FH Key Location/Qualifiers 
FH 

FT source 1. .3729 

FT /db_xref="taxon: 10090" 

FT /organism="Mus musculus" 

FT CDS 1. .3729 

FT /codon_start=l 

FT / db_xref ="S PTREMBL : Q9QZS7 
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# [EDITOR- [540-4 ♦ LOG] ] 
/note = "immunoglobulin super^^L; 



FT /note = "immunoglobulin super^^Ly member" 

FT /gene= n Nphsl n 

FT /product= n nephrin" 

FT /protein_id="AAF03368 . 1" 

FT /translation= n MALGTTLRASLLLAGMLTTGLAQSPVPTSAPRGFWALSENLTVVE 

FT GST I KLWCGVRAPGS WQWAKDGLLLGPNPKI PGF PRY S LE GDS AKGE FH LL I E ACDL S 

FT DDAEYECQVGRSELGPELVSPRVILSVLVPPKVLQLTPEAGSTVTWVAGQEYWTCVSG 

FT GAKPAPDII FIQGGRTVEDVSSSVNEGSEEKLFFTEAEARVTPQSSDNGQLLVCEGSNP 

FT ALATPIKASFTMNILFPPGPPVIDWPGLNE GHVRAGENLELPCIARGGNPPATLQWLKN 

FT GKPVSIAWGTEHAQAVAHSVLVMTVRPEDHGARLSCQSYNSVSAETQERSITLQVTFPP 

FT SAVTILGSTSQSENKNVTLCCLTKSSRPRVLLRWWLGGRQLLPTDETVMDGLHGGHISM 

FT SNLTLLVKREDNGLSLTCEAFSDAFSKETFKKSLTLNVKY PAQKLWIEGPPEGQSIRTG 

FT TRVRLVCLAIGGNPE PSLTWLKDSRPVNDPRQSQEPRRVQLGSVEKSGSTFSRELVLI I 

FT GPPDNLAKFSCKAGQLSASTQLVVQFPPTNLTILANSSALRPGDALNLTCVSISSNPPV 

FT " MLSLDKEGERLDDVAAKPQSAPFKGSAASRSVFLRVSSRDHGHRVTCRAHSEALRETVS 
FT 

S FYRLNVLY P PE FLGEQVRAVT WEQGQALLPVSVS ANPAPEAFNWT FRGYRLS PAGGP 

SCORES Initl: 14308 Initn: 15239 Opt: 14974 z-score: 21379.6 E(): 0 

92.6% identity in 3458 bp overlap 

10 20 30 40 

Hn54 0-1 . Dna ATGTCCAGTTTGACTCCCCTGCTGCTCATGGGAATGCTGACCTCAGGC 

! II I I I II I I I I I I I I I I I I I I I I I I I Mi 

Af 168 4 66 ATGGCCCTGGGGACGACGCTCAGGGCTTCTCTGCTGCTCGCGGGAATGCTGACCACGGGC 

10 20 30 40 50 60 

50 60 70 80 90 100 

Hn5 40-1 . Dna CTGGCCGAGTCGCCAGTCCCCACCTCAGCACCTCGAGGCTTCTGGGCTCTGTCTGAAAAC 

I I i I! I I I I I I I I i I I I I I I I \ I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Af 168 4 66 CTGGCCCAGTCGCCAGTCCCCACCTCAGCACCTCGAGGCTTCTGGGCTCTATCTGAAAAC 

70 80 90 100 110 120 

110 • 120 130 140 150 160 

Hn54 0-1 . Dna CTGACTGCGGTGGAAGGGACAACAGTTAAGCTATGGT GCGGTGTCAGGGCCCCTGGCAGT 
I I I I I I I i I I I I I I I I I I III II I I I I I I I I I I II I I I I M I I I I I I I I I I I 
Af 168 4 66 CT GACT GT GGT GGAAGGGT C GACAATT AAGCT GT GGT GT GGC GT C AGGGC C C C CGGCAGT 

130 140 150 160 170 180 

170 180 190 200 210 220 

Hn540-1 . Dna GTGGTGCAGTGGGCTAAGGATGGGCTGCTTCTGGGTCCAAACCCGAAGATGCCAGGCTTC 

I I I I I I I I I I I ! I I ! I I I I I I I I I I I I I I I I I I I! I I I I I I I I I Mill II M 1 I 1 I ! 
Af 1 6 8 4 6 6 GT GGT GC AGT GGGC T AAGGAT GGGC T GC T T CT GGGT C C AAAC C C T AAGAT T G CAGGCT T C 

190 200 210 220 230 240 

230 240 250 260 270 280 

Hn540- 1 . Dna CCGAGGTACAGCCTGGAAGGAGATCGT GCTAAAGGCGAGTTCCACCTGCTTATTGAAGCC 

II II II I II I II II II I I II II I II I I II I I I II II I I M II I! I II II I I I II II 
Af 168 4 66 CCAAGGTACAGCCTGGAAGGAGACAGTGCTAAAGGTGAGTTCCACCTGCTTATTGAAGCC 

250 260 270 280 290 .300 

290 300 310 320 330 340 

Kn54 0-1 . Dna T GT GAC CT C AGT GAT GAC GC AGAGT AT GAAT GC CAAGT CGGCCGCT C AGAGT T GGGT C C C 
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I I I I INN i I I I ! I i I I ! I I I ! I M I M I I I I I I I I II I t I 

Af 168 4 66 T GT G AC C T C AGC GAT GAT GC GGAGT AC GAGT GC CAAGT C GGC C GCT C C GAGT T GGGT C C C 



310 320 330 340 350 360 

350 360 370 380 390 400 

Hn540-1 . Dna GAGCTTGT GTCTCCTAAAGTAATCCTCTCCATTCTAGTTTCCCCCAAGGT GCTTCTGTTG 

I I ! I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I EM 
Af 168 4 66 GAGCTCGTGTCTCCCAGAGTAATCCTCTCCGTCCTAGTTCCCCCCAAGGTGCTTCAGTTA 

370 380 390 400 410 420 

410 420 430 440 450 460 

Hn540-1 . Dna ACCCCCGAGGCAGGAAGCACAGT GACCT GGGTAGCTGGGCAGGAGTAT GT GGT CACCTGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I ! I I I I I I I I I I I I I I I I I 

Af 1 6 8 4 6 6 AC CC CT GAGGC AGGAAGCACAGTT ACCT GGGTAGCT GGACAGGAAT AT GT GGT CAC CT GT 

430 440 450 460 470 480 



470 480 490 500 510 520 

Hn5 4 0- 1 . Dna GT GT CTGGGGAT GCAAAACC AGC ACCT GACAT CAC CTT C AT CCAGAGT GGACGAACTAT A 
MINIMI! I I I ! I i I M I ! I II II I II M I M I I I I I I I I II I I I I I II II 
Af 1 6 8 4 6 6 GT GT CTGGGGGT GC AAAGC CAGCAC C T GACAT CAT CTT CAT C CAGGGTGGAC GCAC GGT A 

490 500 510 520 530 540 

530 540 550 560 570 580 

Hn540-1 . Dna T T GGAC GT CT C CT C C AAT GT GAAT GAGGGAT C AGAGGAGAAACT CT GC AT C AC AGAGGC C 



III I I I I I I II I I I I I I I I II II II I I I M I I I II I II I I I II I I I I Ml 

Af 168 4 66 GAGGAT GT CT CCT CCAGCGT GAAT GAGGGAT CAGAGGAAAAACT CTT CTT CA.C GGAAGC C 

550 560 570 580 590 600 

590 600 610' 620 630 640 

Hn540-1 . Dna GAAGCCAGGGTGATACCCCAGAGCTCGGATAACGGGCAGTTACTGGTCTGTGAGGGTTCC 
I I I II I I I M I II I I II I I II I M I II II I I I I M I I II I I I I I Mill Ml 
Af 1 68 4 66 GAAGCCAGGGTGACACCCCAGAGCTCAGATAATGGGCAGCTGCTAGTCTGCGAGGGGTCC 

610 620 630 640 650 660 

650 660 670 680 690 700 



Hn540-1 . Dna AACCCAGCTTTGGACACTCCCATAAAGGCTTCATTCAC CATGAATATTCTGTTTCCCCCA 
I I I M II I MM II I I I I I I I I I I I II I I I I M I I M M M I I I I I I ! I I M II I 
Af 1 68 4 66 AACCCAGCCTTGGCCACTCCCATAAAGGCTTCGTTCACCATGAATATCCTGTTCCCCCCA 

670 680 690 700 710 720 



710 720 730 740 750 760 

Hn540- 1 . Dna GGAC CTCCTGT CAT T GAT T GGC CAGGCCT GAAT GAAGGGC AT GTGAGGGCAGGGGAGAAC 

I I I I I M I I II I II I M II I II II I II M I II I I I I I I II II I M I I I! II II II I 
Af 1684 66 GGACCCCCTGTCATTGATTGGCCAGGCCTGAATGAGGGGCATGTACGGGCAGGGGAGAAC 

730 740 750 760 770 780 



770 780 790 800 810 820 

Hn54 0-1 . Dna CT GGAGCT GC C CT GCACAGCCAGA.GGT GGCAAT CCACCT GCTAC C CTGC AGT GGCT GAAG 

I II I II II M II II I II I II II II I I I I I I I II II I II II I II I M II I II II M I 
Af 1 68 4 6 6 C T GGAGC T AC C CT GC AT AGC CAGAGGT GGAAAT C CAC C T GC GAC CCT GC AGT GGC T GAAG 

790 800 810 820 830 - 840 

830 840 850 860 870 880 

Hn540-1 . Dna AACGGT AAAC C AGT GT C CAC AGC CT GGGGC AC CGAGC AT GC C CAGGC AGT GGC C CAC AGT 

II M M I I I M I II II II 11! MINIM M II II II i I II I I II I I II I II I I I 
Af 1 68 4 6 6 AAT GGT AAAC CAGT GT C CAT AGCT T GGGGCACAGAGC AT GCCCAGGC AGT GGCT CACAGT 

850 860 870 880 890 900 

890 900 910 920 930 940 

Hn540-1 . Dna GT GCT GGT GAT GACTGTAC GAC CTGAAGAC CAT GGAGCTC GGCT CAGCT GT CAGT CCTAC 
M I M M I M I I M M M II II II II I II I I I I II II I M I II II M II I I I II II I 
Af 168 466 GT GCT GGT GAT GACCGTTCGACCTGAAGACCACGGAGCTCGGCT CAGCT GT CAGT CCTAC 

910 920 930 940 950 960 
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950 960 970 980 ^^^90 1000 

Hn5 4 0- 1 . Dna AACAGCGTGTCTGCAGGGACCCAGGAGAGAAGCATCACACTACAGGTCACCTTTCCCCCA 
(ill) I I I I I I I I I I I ! I I I I I I I I I I I I II M I I II I II I I I I I I I I I 1 I I I I 

Af 1 68 4 66 AAC AGT GT GT CT GC AGAGAC C C AGGAGC GAAGCAT C ACT C T GC AGGT CAC CT TTCCCCCC 

970 980 990 1000 1010 1020 

1010 1020 1030 1040 1050 1060 

Hn5 40-1 . Dna AGC GC CAT T AC CAT C C T GGGAT CT GT AT C AC AAT C GGAGAACAAGAAC GT GAC C CT T T GC 
II III I I I I I I I I I I I I I I I I I I I I i I I II I I I I I I I I M I I I I ! I I I I I I i 
Af 168 466 AGT G C C GT T AC CAT C C T GGGAT CT ACAT CAC AGT C T GAGAACAAAAAT GT GAC C C T T T GC 

1030 1040 1050 1060 1070 1080 

1070 1080 1090 1100 1110 1120 

Hn540-1 . Dna TGCCTGACCAAGTCCAGTCGCCCACGGGTCCTGCTGCGATGGTGGTTGGGT GGACGGCAG 

I I I II I I I I I I I II I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Af 168 4 66 TGCCTTACCAAGTCCAGTCGCCCACGGGTCCTGCTGCGATGGTGGTTGGGTGGACGGCAG 

1090 1100 1110 1120 1130 1140 

1130 1140 1150 1160 1170 1180 

Hn5 40-1 . Dna CT GC T GC C C AC AGAT GAGACAGT C ATGGAT GGCCT GCAT GGT GGC C ACAT CT C CAT GT C C 
I I I I I I I I I I I I I M I I I I I I I I I ! I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I 
Af 168 4 66 T T GC TGCC CAC GGAT GAGACAGT CAT GGAT GGCCT GCAT GGT GGC CACATCTC CAT GTCC 

1150 1160 1170 • 1180 1190 1200 

1190 1200 1210 1220 1230 1240 

Hn540-1 . Dna AATCTCACATTCTTGGTGCGGAGAGAAGACAATGGCCTGCCCCTCACGT GTGAAGCCTTC 
I I I I I III I II I II II I I I I I I I II I I I I I I 1 I I I I I I I I I I II I I I I I I I I I 
Af 168 4 66 AATCTGACACTCTTGGTGAAGAGAGAAGACAATGGCCTGTCCCTCACCTGCGAAGCCTTC 

1210 1220 1230 1240 1250 1260 

1250 1260 1270 1280 1290 1300 

Hn540- 1 . Dna AGT GAC GC CT T CAGCAAGGAGAC C T T C AAGAAGT CAC T CAC C T T G AAT GT GAAAT AC C C T 

1 I I I I I I I I 1 I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Af 1 68 4 6 6 AGT GAT GC CT T CAGCAAGGAGAC C TT CAAGAAGT C ACT C AC CT T GAA.T GT AAAAT AC C C G 

127.0 1280 1290 1300 1310 1320 



1310 1320 1330 1340 1350 1360 

Hn5 40 - 1 . Dna GCCCAGAAGCTGTGGATTGAGGGGCCCCCAGAGGGACAGTACATCCGGACTGGGACTCGG 
II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II III I I I I I I I I I I I I I I I I I I 
Af 168 4 66 GC C C AGAAGCT GT GGATT GAGGGACCCCC AGAGGGGCAGAGCAT C CGGACTGGAACT C GG 

1330 1340 1350 1360 1370 1380 

1370 1380 1390 1400 1410 1420 

Hn540-1 . Dna GTGAGGCTGGTATGCTTGGCCATCGGAGGCAACCCAGACCCCTCCCTCATCTGGTTTAAG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I Mill 

Af 168 4 66 GTGAGGCTGGTATGCTTGGCCATTGGAGGCAACCCAGAGCCCTCCCTCACCTGGCTTAAG 

1390 1400 1410 1420 1430 1440 

1430 1440 1450 1460 1470 1480 

Hn540-1 . Dna GATTCACGTCCGGTGAGCGAGCCCCGGCAGCCCCAGGAGCCCCGGCGTGTGCAGCTGGGC 
I I I I I II I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I 
Af 168 4 66 GATTCGCGCCCGGTGAACGATCCTCGGCAGTCTCAGGAGCCCCGGCGTGTGCAGCTGGGC 

1450 1460 1470 1480 1490 1500 

1490 1500 1510 1520 1530 1540 

Hn540-1 . Dna AGT GT GGAGAAGT C C GGGAGC AC TTTCTCCC GC GAGCT GGT GT T GAT CAT AGGT C C GC C G 
I 1 I I I I I I I I I I I I I I I I I I I I I I I I II I I | | | | | | | | | | | | I I ! I I | I I I I I I II I 

Af 1 6 8 4 6 6 AGT GT GGAGAAGT CCGGC AGC ACTTTCTCCCGC GAGCT GGT GCT GAT CAT AGGCCCGCCG 

1510 1520 1530 1540 1550 1560 

1550 1560 1570 1580 1590 1600 

Hn540-1 . Dna GACAACCGAGCCAAGTTCTCCTGCAAGGCGGGTCAGCTCAGTGCGTCTACGCAGCTGGTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I i I I I I I I I I I 
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Af 1 6 8 4 6 6 GAC^^^TAGCCAAGTTCTCCTGCAAGGCGGGTCAC^BrAGTGCGTCTACGCAGCTGGTG 

1570 1580 1590 1600 1610 1620 

1610 1620 1630 1640 1650 1660 

Hn540-1 . Dna GTGCAGTTCCCCCCAACCAACCTGACCATCCTGGCCAACTCGTCCGCGCTGCGCCCAGGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Af 168 4 66 GTGCAGTTCCCCCCAACAAACCTGACCATCCTGGCCAACTCGTCCGCACTGCGCCCAGGC 

1630 1640 1650 1660 1670 1680 

1670 1680 1690 1700 1710 1720 

Hn5 40-1 . Dna GACGCCTTGAACTTGACCTGCGTCAGCATCAGCAGCAACCCCCCAGTCAACTTGTCTTGG 
I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I 1 I I i II I I I I I I I I I I I I I I I I I 
Af 168 4 66 GACGCCTTGAACTTGACCTGCGTCAGCATCAGCAGCAACCCTCCAGTTAACTTGTCTTTG 

1690 1700 1710 1720 1730 1740 

1730 1740 1750 1760 1770 1780 

Hn5 4 0 - 1 . Dna GACAAGGAAGGAGAGAGGCT GGAAGAT GT GGC T GCAAAAC C C C AGAGT GC AC C GT T CAAA 
I ! I I I I I I I I I I I I I ! I I I I I I I II I I I I I I II I I I I I I II I I I I" II II I I I I I I 
Af 168 4 66 GACAAGGAAGGAGAGAGGCT GGAC GAC GT GGCT GCAAAAC C C C AGAGC GC C C CAT T CAAA 

1750 1760 1770 1780 1790 1800 

1790 1800 1810 1820 1830 1840 

Hn540-1 . Dna GGCTCCGCTGCATCCAGGAGT GTTTTTCTCAGAGTGT CATCCCGAGACCACGGT CAACGG 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Af 168 4 66 GGCTCCGCTGCATCCAGGAGT GTTTTTCTTCGGGT GT CAT CCCGAGACC AC GG TCACCGG 

1810 1820 1830 1840 1850 1860 



1850 1860 1870 1880 1890 1900 

Hn540-1 . Dna GTCACCTGCCGGGCCCACAGCGAGGCA.CTCCGTGAAACCGTGAGCTCCTTCTACCGCTTC 

I I I I I I M I I I I I I I I I I I I I I I i I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Af 168 4 66 GTTACCTGCCGGGCCCACAGCGAGGCACTTCGTGAAACCGTGAGCTCTTTCTACCGCCTC 

1870 1880 1890 1900 1910 1920 

1910 1920 1930 1940 1950 1960 

Hn54 0-1 . Dna AAT GT GCT GTAT C CT CCAGAAT T C CT GGGGGAGCAAGT C C GGGCAGT GACCGT GGT GGAG 

II (Ml II I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 
A f 1 6 8 4 6 6 AAC GT GT T AT AC C CT C C AGAGT T C CT GGGAGAGC AAGT GC GGGCAGT GAC C GT GGT GGAG 

1930 1940 1950 1960 1970 1980 

1970 1980 1990 2000 2010 2020 

Hn540~l . Dna CAGGGCCAGGTGCTGCTGCCGGTGTCGGTGTCCGCTAACCCCGCCCCCGAGGCCTTCAAC 
I I I I I I I I I I II I I I I I I I I I II I I I I I I I 1 I I I I I I II I I I I I I I I II I ! I I I I 

Af 168 4 66 CAGGGCCAGGCACTGCTGCCTGTGTCCGTGTCTGCTAACCCCGCCCCCGAGGCCTTCAAC 

1990 2000 2010 2020 2030 2040 

2030 2040 2050 2060 2070 2080 

Hn5 4 0-1 . Dna T GGAC CTTCCGAGGCTACCGCCTCAGCCCAGCTGGGGGTCCCCGGCACC GTAT CCTGTCT 
I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I 

Af 168 4 66 T GGAC CTTCCGAGGCTACCGCCTCAGCCCAGCTGGGGGTCCCCGGCACCGCAT CCTGTCT 

2050 2060 2070 2080 2090 2100 

2090 2100 2110 2120 2130 2140 

Hn5 4 0-1 . Dna GGAGGGGCTCTGCAGCTGTGGAATGTGACCCGAGCTGACGATGGCTTTTATCAGCTGCAC 

I I I I I 11 I I I I I I II II I I I I I I I I I I I I I I | | | | | | || | | | | | | | I | | I I I I I | | 
Af 1684 66 GGAGGGGCACTGCAGCTGTGGAATGTAACCCGAGCTGACGATGGCTTTTATCAGCTACAT 

2110 2120 2130 . 2140 2150 2160 

2150 2160 2170 2180 2190 2200 

Hn54 0-1 . Dna T GC C AGAAC T C AGAGGGC AC C GC T GAGGC GCT GT T GAAGC T GGAC GT GC AT TAT GC T C C C 

I I I I I I I I I I I I I I I I Mill II I I II I I II I I I I I I II I I M I I I I I I I I I I I I I I 
Af 168 4 66 TGCCAGAACTCGGAGGGTACCGCCGAGGCGCTGTTGAAGCTGGACGTGCATTATGCTCCC 

2170 2180 2190 2200 - 2210 2220 
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2220 2230 2240 



2210 2220 2230 2240 ^^^5 0 2260 

Hn540-1 . Dna ACCATCCGTGCCCTCCGGGACCCTACTGAGGTGAATGTTGGGGGTTCTGTGGACATAGTC 

I I I I I I I I i I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I MIIIS 

Af 168 4 66 AC CAT CCGT GC CCT GAAGGACCCT GCT GAGGT GAAT GTT GGGGGTT CT GT GGAT ATAGT C 

2230 2240 2250 2260 2270 2280 

2270 2280 2290 2300 2310 2320 

Hn540-1 . Dna T GC AC C GT T GAC GC CAAT C C CAT C CT C C CAGAGAT GT T C AGCT GGGAGAGACT GGGAGAA 

I I II I I I I II I I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I III 
Af 168 4 66 T GC AC C GT C GAT GC CAAT C C CAT C CT C C CAGAGAT GT T C AGT T GGGAGAGGC T GGGGGAA 

2290 2300 2310 2320 2330 2340 

2330 2340 2350 2360 2370 2380 

Hn5 4 0- 1 . Dna GAAGAGGAGGAT C T GAAC CT GGAC GAC AT GGAGAAAGT T T C CAAGGGAT C C AC GGGGC GT 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I II I II I I I I I I I I I I I I I I 
Af 1 6 8 4 6 6 GAC GAGGAGGAACT GAAC CT GGAC GAC AT GGAGAAGAT GT C AAAGGGAT C C AC AGGGC GT 

2350 2360 2370 2380 2390 2400 



2390 2400 2410 2420 2430 2440 

Hn540- 1 . Dna C T GC GGAT T C GC C AAGC C AAGC TAT C C CAGGC T GGT GC C T AC C AGT GC AT C GT GGAC AAT 

I I I I 1 I I II I I I I I I I I ! I I I I I I ! I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Af 1 6 8 4 6 6 CTGCGGATTCGCCAAGCCAAGCTGTCCCAGGCTGGCGCTTACCAGTGCATCGTGGACAAC 

2410 2420 2430 2440 2450 2460 

2450 24 60 2 47 0 2480 2490 2500 

Hn540-1 . Dna GGGGTGGCTCCTGCAGCCAGAGGACTGGTTCGTCTTGTCGTCCGATTTGCTCCCCAGGTG 

1 1 1 1 M M M I 1 1 1 M 1 1 i i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i i 

Af 168 4 66 GGGGTGGCTCCCGCAGCCAGAGGACTGGTTCGTCTTGTCGTCCGATTTGCCCCCCAGGTG 

2470 2480 2490 2500 2510 2520 

2510 2 52 0 2530 2 540 2550 2560 

Hn540-1 . Dna GATCAGCCTACTCCCCTAACAAAAGTGGCTGCCGCTGGGGACAGCACCAGCTCAGCCACA 

I I I I I I I I I I I I I II I M I I I I I I II I I I I I I I I II I I I I I I I I M I I I I I I I I I 
Af 168 4 66 GATCATCCTACTCCCCTGACGAAAGTGGCTGCTGCTGGGGACAGCACCAGCTCGGCCACA 

2530 2540 2550 2560 2570 2580 

2570 2580 2590 2600 2610 2620- 

Hn54 0-1 . Dna CTGCACTGCCGTGCCCGGGGT GTCCCCAACATCGACTTCACTTGGACCAAAAACGGGGTC 

II I I I I I I I I I I I I I I I I I I I M I I I I I I I I ! I I I I I I I i I I I II I I I I I I MINI 

Af 1 6 8 4 6 6 CT C CACT GC C GT GCC C GGGGGGT C C CCAACAT C GACTT C ACTT GGAC CAAAAAT GGGGT C 

2590 2600 2610 2620 2630 2640 

2630 2640 2650 2660- 2670 2680 

Hn5 40-1 . Dna CCTCTGGATCTCCAAGACCCCAGGTACACAGAGCACAGGTACCACCAGGGT GTTGTCCAC 

I I I I I I M I 1 I I I I I I I I I II I I M I I I I i I I I I I I I I I I I I I I II MINI 

Af 1 6 8 4 6 6 C CT CT GGAT CT C CAAGAC C C C AGGT AC AC AGAGCACAA.GT AC C AC CAGGGT GT GGT C C AC 

2650 2660 2670 2680 2690 2700 

2690 2700 . 2710 2720 2730 2740 

Hn540-1 . Dna AGCAGCCTCTTGACCATCGCTAATGTGTCTGCGGCCCAGGACTATGCCCTCTTCAAATGC 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I | I I I I I I I I I I I I I II II I I 1 1 I I I I I 
Af 1 68 4 66 AGCAGCCTCCTGACCATTGCTAATGT GTCTGCAGCCCAGGACTACGCCCTCTTCAAATGC 

2710 2720 2730 2740 2750 2760 

2750 2760 2770 2780 2790 2800 

Hn5 4 0-1 . Dna ACGGCCACCAATGCCCTTGGCTCTGACCACACCAACATCCAGCTCGTCAGCATCAGCCGC 

II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I f I I I I I I I I I I I I I I i 
Af 1 6 8 4 66 ACAGCCACCAATGCCCTTGGTTCGGACCACACCAACATCCAGCTCGTCAGCATCAGCCGT 

2770 2780 2790 2800 2810 2820 

2810 .2820 2830 2840 2850 2860 

Hn540-1 . Dna C CT GAC C CT C CACT GGGACT GAAGGT T GT CAGCAT AAGC CCT CACTC GGT GGGGCT GGAG 
I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I 11 I I I 11 I I I I I I 
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CT C C ACT GGGACT GAAGGT T GT GAGC GT Pb CT C ACT C GGT AGGACT GGAG 
2830 2840 2850 2860 2870 2880 



2870 2880 2890 2900 2910 2920 

Hn5 40-1 . Dna TGGAAGCCTGGCTTTGATGGGGGTCTGCCTCAGAGGTTCCAAATCAGGTACGAGGCCCTC 
Mill I I I I I I I I I II I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I 
Af 168 466 TGGAAACCTGGCTTTGATGGGGGTCTGCCTCAGAGGTTCCAAATCAGGTATGAGGCCCTC 

2890 2900 2910 2920 2930 2940 



2930 2940 2950 2960 2970 ' 2980 

Hn540- 1 . Dna GAGACCCCAGGATTCCTCCACGTGGATGTCCTACCTACACAGGCCACTACCTTCACGCTG 
I I I I i I I I I I I I I i I I I I II I I I I I I I I I I III I I I I I I I I I I I I I I I I I I III 
Af 1 68 4 6 6 GAGAC C C C AGGAT T C CT CT AC AT GGAT GT C CT GC CT GCAC AGGC C ACC AC CT T C ACAC T G 

2950 2960 2970 2980 2990 3000 



2990 3000 3010 3020 3030 3040 

Hn540-1 . Dna ACT GGGCTGAAGCCTTCTACACGAT AT AGGAT CTGGCTGTTGGCCAGCAAT GCCCT GGGG 
I I I I I I i I I I I I I I I I I ! I I I I I I I I I I I II I I i I I I I I I I! I I i I I I I I I I I i II I I 
Af 168 4 66 ACT GGGCTGAAGCCTTCTACACGGTACAGGAT CTGGCTGTTGGCCAGCAAT GCCCT GGGG 

3010 3020 3030 3040 3050 3060 



3050 3060 3070 3080 3090 3100 

Hn540-1 . Dna GAC AGT GGAT T GAC GGACAAGGGGAT C C AGGT C T C C GT CACT AC C C C AGGC C C C GAC C AG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I 
Af 1 6 8 4 6 6 GAC AGT GGAT T GAC GGACAAGGGGAT CCAGGT CT C CATCACTAC CC CAGGC CT GGACCAG 

3070 3080 3090 3100 3110 3120 

3110 3120 3130 3140 3150 3160 

Hn540-1 . Dna GCTCCTGAAGACACAGACCACCAGCTGCCCACAGAGCTGCCTCCAGGACCCCCAAGGCTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill! I I I I I I I I I I I I I I 



Af 1 63 4 66 GCTCCTGAAGACACAGACCAGCCGCTGCCCACAGAGCAGCCTCCGGGACCCCCGAGGCTG 

3130 3140 3150 3160 3170 3180 

3170 3180 • 3190 3200 3210 3220 

Hn540-1 . Dna CCCCTGCTGCCTGTGCTCTTTGCAGTTGGTGGTCTTCTGCTGCTCTCCAATGCCTCCTGT 
MM I I II I II I I I I I I I M I I II I I I M I I I I I II I MM I M I I II M I II I I I 
Af 168 4 66 CCCCAGCTGCCTGTGCTCTTTGCGGTTGGTGGTCTTCTGTTGCTTTCCAATGCCTCCTGT 

3190 * 3200 3210 3220 3230 3240 



3230 3240 3250 3260 3270 3280 

Hn540-1 . Dna GTTGGGGGTCTCCTCTGGCGGAGAAGACTGAGGCGCCTTGCTGAGGAGATCTCAGAGAAG 

I II II I II I I I II I I I I I I M I I II II II I II II I II I II I II I II II II I I I I II I II 

Af 1 68 4 66 GTTGGGGGACTCCTCTGGCGGAGAA.GACTGAGGCGCCTTGCTGAGGAGATCTCAGAGAAG 

3250 3260 3270 3280 . 3290 3300 



3290 3300 3310 3320 3330 3340 

Hn540- 1 . Dna ACAGAGGCAGGGTCGGAGGACAGGATCAGGAATGAATATGAGGAGAGTCAGTGGACT 
II II II II II I II I II II II I I I M I I I I I I I I I I I I M I I I I M I M I I I I I I 

Af 1 68 4 6 6 ACAGAGGCAGGGT CGGAGGAGGAT CGAAT CAGGAAT GAAT AT GAGGAGAGT CAGT GGACT 

3310 3320 3330 3340 3350 3360 

3350 3360 3370 3380 3390 3400 

Hn540-1 . Dna GGGGACCGGGACACGAGAAGCTCCACGGTTAGCACAGCAGAAGT GGACCCAAATTACTAC 
I I I M I I I II I I I I I M I I M I I I II I I I I II I I I I I II II I I II I I I II I II II I I 
Af 1 68 4 66 GGGGACCGGGACACAAGAAGCT CC AC GGTTAGCACAGCAGAAGT GGACCCACACTACTAC 

3370 3380 3390 3400 3410 3420 



3410 3420 3430 3440 3450 3460 

Hn5 4 0- 1 . Dna TCCATGAGGGACTTCAGCCCCCAGCTTCCCCCAACACTGGAGGAGGTGCTGTATCACCAA 
I I I M I I M I I I I II M I I I I I II I I I I I I I I I I II I I I I II II I I I I II I I II 
Af 168 4 66 TCCATGAGGGACTTCAGTCCCCAGCTTCCCCCAACACTGGAAGAGGTGTCATATCGCCAA 

3430 3440 3450 3460 3470 3480 
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34^^ 3480 3490 3500 3510 3520 

Hn540-1 . Dna GGT GC T GAAGGCGAGGAC AT GGC CT T C C C C GGAC AC C T GCAT GAT GAAGT GGAGAGAGC C 
I 

Af 168 466 GC CT T C ACAGGT AT T GAAGAT GAGGACAT GGC C T T C C C C GGAC AC CT GT AT GAC GAGGT G 

3490 3500 3510 3520 3530 3540 



Hn540-l.Dna 
Emhuml :Af 035835 



ID AF035835 standard; RNA; HUM; 4285 BP. 

AC AF035835; 

SV AF035835.1 

DT 08-APR-1998 (Rel. 55, Created) 

DT 03-MAR-2000 (Rel. 62, Last updated, Version 3) 

DE Homo sapiens nephrin (NPHS1) mRNA, complete cds. 
KW 



OS Homo sapiens (human) 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; Mammalia; 

OC Eutheria; Primates; Catarrhini; Hominidae; Homo. 
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RA Ruotsalainen V., Morita T., Nissinen M. , Herva R., Kashtan C.E., 

RA Peltonen L . , Holmberg C., Olsen A., Tryggvason K.; 

RT "Positionally cloned gene for a novel glomerular protein--nephrin--is 

RT mutated in congenital nephrotic syndrome"; 

RL Mol. Cell 1 (4) :575-582 (1998) . 

RN [2] 

RP 1-4285 

RA Lenkkeri U. , Kestila M., Mannikko M. , Lamerdin J., McCready p., Putaala H., 

PA Ruotsalainen V., Morita T., Nissinen M. , Herva R., Kashtan C.E., 

RA Peltonen L . , Holmberg C, Olsen A., Tryggvason K.; 

RT 

RL Submitted ( 2 6-NOV- 1 997 ) to the EMBL/GenBank/DDB J databases. 

RL Biochemistry, University of Oulu, Linnanmaa, Oulu 90570, Finland 

DR SPTREMBL; O60500; 060500. 



FH Key Location/Qualifiers 
FH 

FT source 1. .4285 

FT /chromosome="19" 

FT /db_xref="taxon: 9606" 

FT /organism="Homo sapiens" 

FT /map="19ql3. 1" 

FT CDS 1. .3726 

FT /codon_start=l 

FT /db_xref= "SPTREMBL: 060500" 

FT /gene="NPHSl" 

FT /product=" nephrin" 

FT /protein_id="AAC39687 . 1" 

FT / trans la tion="MALGTTLRASLLLLGLLTEGLAQIiAI PASVPRGFWALPENLTWE 

FT GASVELRCGVSTPGSAVQWAKDGLLLGPDPRIPGFPRYRLEGDPARGEFHLHIEACDLS 

FT DDAEYECQVGRSEMGPELVSPRVILSILVPPKLLLLTPEAGTMVTWVAGQEYWNCVSG 

FT DAKPAPDITILLSGQTISDISANVNEGSQQKLFTVEATARVTPRSSDNRQLLVCEASSP 

FT ALE AP I KAS FTVNVL F PPGP PVI EW PGLDE GHVRAGQS LE LPCVARGGNPLAT LQWLKN 

FT GQPVSTAWGTEHTQAVARSVLVMTVRPEDHGAQLSCEAHNSVSAGTQEHGITLQVTFPP 

FT SAIIILGSASQTENKNVTLSCVSKSSRPRVLLRVrWLGWRQLLPMEETVMDGLHGGHISM 
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• [EDITOR- [540 -4. LOG] ] . 4t% 
SNLTFLARREDNGLTLTCEAFSEAFTKE^^R. 



ft snltflarredngltltceafseaftke^^kslilnvkypaqklwiegppegqklr; 

FT 

TRVRLVCLAIGGNPEPSLMWYKDSRTVTESRLPQESRRVHLGSVEKSGSTFSRELVLVT 

SCORES Initl: 11557 Initn: 12214 Opt: 12066 z-score: 17125.7 E(): 

83.1% identity in 3474 bp overlap 

10 20 30 40 

Hn540-1 . Dna ATGTCCAGTTTGACTCCCCTGCTGCTCATGGGAATGCTGACCTCAGGC 

I I I I I i I I I I i I I I I I I I I I I I I MM 
Af 035 835 ATGGCCCTGGGGACGACGCTCAGGGCTTCTCTCCTGCTCCTGGGGCTGCTGACTGAAGGC 

10 20 30 40 50 60 



50 60 70 80 90 100 

Hn54 0-1 . Dna CTGGCCGAGTCGCCAGTCCCCACCTCAGCACCTCGAGGCTTCTGGGCTCTGTCTGAAAAC 
Mill Mill 111 I I I I I ! I II II II II I I I I I I I I M I I I I I I 

Af 0 3 5 8 3 5 CTGGCGCAGTTGGCGATTCCTGCCTCCGTTCCCCGGGGCTTCTGGGCCCTGCCTGAAAAC 

70 80 90 100 110 120 

110 120 130 140 150 160 

Hn540-1 . Dna CTGACTGCGGTGGAAGGGACAACAGTTAAGCTATGGTGCGGTGTCAGGGCCCCTGGCAGT 
II I II I I II II I I II I II I I II II I II ! I M I II II II II II II I 
Af 0358 35 CT GAC GGT GGT GGAGGGGGC CT C AGT GGAGCTGC GTT GT GGGGT CAGC AC C C CT GGCAGT 

130 140 150 160 170 180 

170 180 190 200 210 220 

Hn5 40-1 . Dna GTGGTGCAGTGGGCTAAGGATGGGCTGCTTCTGGGTCCAAACCCGAAGATGCCAGGCTTC 

I M I I M Mill II M I II M I I II Mill II MM I Ml I I I II I II I 

Af 0 3 5 8 3 5 GCGGTGCAATGGGCCAAAGATGGGCTGCTCCTGGGCCCCGACCCCAGGATCCCAGGCTTC 

190 200 210 220 230 240 

230 240 250 260 270 280 

Hn540-1 . Dna CCGAGGTACAGCCTGGAAGGAGATCGTGCTAAAGGCGAGTTCCACCTGCTTATTGAAGCC 
I M II M I I. II II II I II I M I Mill III II I M I II II II M M Ml 

Af 0 3 5.8 3 5. CCGAGGTACCGCCTGGAAGGGGACCCTGCTAGAGGTGAATTCCACCTGCACA.TCGAGGCC 

250 260 270 280 290 300 

2S0 300 310 320 330 340 

Hn540-1 . Dna TGTGACCTCAGTGATGACGCAGAGTATGAATGCCAAGTCGGCCGCTCAGAGTTGGGTCCC 
I II I II 11 M I I II I II M i I I I I II I II II I I 1 J II I II I II Ml MM III 
Af 0 3 5 8 3 5 TGT GAC CT CAGC GAT GAC GCGGAGTATGAGTGCCAGGTCGGCCGCTCTGAGATGGGGCCC 

310 320 330 340 350 360 

350 360 370 380 390 400 

Hn540-1 . Dna GAGCTTGTGTCTCCTAAAGTAATCCTCTCCATTCTAGTTTCCCCCAAGGTGCTTCTGTTG 

I II II I II II II I I Ml I II M M I I M II III I I II I II MM III M 
Af 0 358 35 GAGCTCGT GTCTCCCAGAGTGATCCTCTCCATCCTGGTTCCTCCCAAGCTGCTCCTGCTG 

370 380 390 400 410 420 

410 420 430 440 450 460 

Hn5 4 0- 1 . Dna ACCC CCGAGGCAGGAAGCAC AGT GAC.CT GGGTAGCT GGGCAGGAGTAT GT GGT CACCT GT 
MM! II I II I I I I II M I M II II II I II I II II II II II I II II II II II 
Af 0 3 5 8 3 5 AC CCCAGAGGCAGGCACC AT GGT CACCT GGGTAGCT GGGCAGGAGTACGT GGT CAACTGT 

430 440 450 460 470 480 

470 480 490 500 510 520 

Hn5 4 0- 1 . Dna GT GT CT GGGGAT GC AAAAC CAGC AC C T GAC AT C AC C T T CAT C C AGAGT GGAC GAACT AT A 
I M II II II II II II II I I II I I I I M II I I I I I Ml I I M I I I I II Ml 
Af 0 3 5 8 3 5 GT GT CT GGGGAC GC GAAGC CAGC AC CT GAC AT C AC CAT T CT C C T GAGT GGAC AGAC AATA 

490 500 510 520 530 540 

530 540 550 560 570 580 
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^aHi ^ [EDITOR- [540-4 . LOG] ] 

tI^gt ct c ct c c aat gt gaat gagggat c agaISto 



Hn5 4 0-1 . Dna TTGl^GTCTCCTCCAATGT GAAT GAGGGAT CAGA(3^iAAACTCTGCATCACAGAGGCC 

I I I I I I I I I I i II I I I I I I I I I I I I I I I I I I I I I I I MINI 

Af035835 TCT GAC AT CT CT GCAAAC GT GAAC GAGGGCT C C C AGC AGAAACT CT T C ACT GT GGAGGC C 

550 560 570 580 590 600 



590 600 610 620 630 640 

Hn540-1 . Dna GAAGCCAGGGTGATACCCCAGAGCTCGGATAACGGGCAGTTACTGGTCTGTGAGGGTTCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 
Af 0 3 5 8 3 5 ACAGCCAGGGTGACACCCCGGAGCTCAGATAATAGGCAGTTGCTGGTCTGTGAGGCGTCT 

610 620 630 640 650 660 

650 660 670 680 690 700 

Hn540-1 . Dna AAC C C AGCTT T GGAC AC T C C C AT AAAGGCT T CAT T CAC CAT GAAT AT T CT GTT T C C C C CA 
I I II I I I I I I I I Mill I I I I I I I i I I I I I I I I I I I I II I I I I II I I I 
Af 0358 35 AGC C C AGC AC T GGAGGC C C C CAT C AAGGC C T CAT T CAC C GT GAAT GT TCT GT TCCCTCCA 

670 680 690 700 710 720 

710 720 730 740 750 760 

Hn54 0- 1 . Dna GGAC CTCCTGT CAT T GAT TGGCCAGGCCT GAAT GAAGGGC AT GT GAGGGCAGGGGAGAAC 

I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I III I I I I I I I III I 
Af 0358 35 GGAC CCCCTGT CAT CGAGT GGCCAGGCCTGGATGAGGGGCACGTGCGGGCAGGACAGAGC 

730 740 750 760 770 780 

770 780 790 800 810 820 

Hn540 - 1 . Dna CTGGAGCTGCCCTGCACAGCCAGAGGTGGCAATCCACCTGCTACCCTGCAGTGGCTGAAG 
I I I I I I I I I I Ml M I II I I II I II I I II II II I II I I II II II II 

Af 0358 35 TTGGAGCTGCCGTGCGTGGCCCGAGGGGGTAATCCCTTAGCCACACTGCAGTGGCTGAAG 

790 800 810 820 830 840 

830 840 850 860 870 880 

Hn540-1 . Dna AACGGTAAACCAGTGTCCACAGCCTGGGGCACCGAGCATGCCCAGGCAGTGGCCCACAGT 

II II I II I M I I II I I I I II li I M I I II I I I II II I I I I I II I I I II I 
Af 03 58 35 AATGGCCAGCCGGTGTCCACAGCGTGGGGCACAGAGCACACCCAGGCGGTGGCCCGCAGT 

850 860 870 880 890 900 

890 900 910 920 930 940 

Hn540-1 . Dna GT GCT GGT GAT GACT GT AC GAC CT GAAGAC CAT GGAGCT C GGCT CAGCT GT CAGT C CT AC 

II II I II M II M I II I M I I I I I II II I II I I I I M I I I M I II I I M 

Af 035 8 35 GT GCT GGT GAT GAC CGTGAGGCCAGAAGAC CAT GGAGCGCAGCT CAGCT GCGAGGCC CAC 

910 920 930 940 950 960 

950 960 970 980 990 1000 

Kn54 0-1 . Dna AACAGCGTGTCTGCAGGGACCCAGGAGAGAAGCATCACACTACAGGTCACCTTTCCCCCA 

I I II II I II I I II II I II II II II M I II I II M II I I II II I M I II M II II 
Af 03 58 35 AAC AGC GT GT C T GC AGGG AC C C AGGAGC AC GGC AT CAC ACT GC AGGT CAC CTTTCCCC CT 

970 980 990 1000 1010 1020 

1010 1020 1030 1040 1050 1060 

Hn540-1 . Dna AGC GC CAT T AC CAT C CT GGGAT C T GT AT C ACAAT C GGAGAAC AAGAAC GT GAC CCTT T GC 
M II I I II I Ml II II II II I III If i II II II I II I II I II I I II I I 
Af 035 8 35 AGT GC CAT TAT TAT C T T GG GAT C T GC AT C C CAGACT GAGAAC AAGAAC GT GAC AC T C T C C 

1030 1040 1050 1060 1070 1080 

1070 1080 1090 1100 1110 1120 

Hn540-1 . Dna TGCCTGACCAAGTCCAGTCGCCCACGGGTCCTGCTGCGATGGTGGTTGGGTGGACGGCAG 
M I I I II I M I II II II II Mill MM! I M II I II I MM I I I II II 
Af 0358 3 5 TGT GTCAGCAAGTC CAGT CGCCCGCGGGTTCTGCTAC GAT GGT GGCT GGGCT GGC GGCAG 

1090 1100 1110 - 1120 1130 1140 



1130 1140 1150 1160 1170 1180 

Hn540-1 . Dna CTGCTGCCCACAGATGAGACAGTCATGGATGGCCTGCATGGTGGCCACATCTCCATGTCC 
I I I M 1 I M I II II II II II II II II I II I II I II I I M II II I II II II II II 
Af 0 3 5 8 3 5 CT GCT GC CCAT GGAGGAGAC AGT CAT GGAT GGACT GCAT GGC GGT CACAT C T C CAT GT CC 
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^^1150 1160 1170 1190 1200 

1190 1200 1210 1220 1230 1240 

Hn54 0-1 . Dna AATCTCACATTCTTGGTGCGGAGAGAAGACAATGGCCTGCCCCTCACGTGTGAAGCCTTC 

Villi I I I I I I I I M I I I I I I I 111 I I I II M Mill MINI 

Af 0 3 5 8 3 5 AACCT GACATT CCT GGC GC GGC GGGAGGACAAC GGT CT GACCCT C AC AT GT GAGGCCTT C 

1210 1220 1230 1240 1250 1260 

1250 1260 1270 1280 1290 1300 

Hn5 4 0- 1 ..Dna AGT GAC GC CT T C AGC AAGGAGAC CT T CAAGAAGT CACT CAC C T T GAAT GT GAAAT AC CCT 

Mill I I I I I I I I I I I I I I I I I I I I I I I | | | | | MM I MM M Mill II 
Af 03 5 8 3 5 AGT GAAGC CT T CAC CAAGGAGAC C TT CAAGAAGT CGC T CAT CCT GAAC GT AAAAT AT C C C 

1270 1280 1290 1300 1310 1320 

1310 1320 1330 1340 1350 1360 
Hn540-1 . Dna GCCCAGAAGCTGTGGATTGAGGGGCCCCCAGAGGGACAGTACATCCGGACTGGGACTCGG 
M I II I I I II I II I II II M I I II II II I II II I M I || II III 

Af 0358 35 GC C C AGAAACT GT GGAT T GAGGGT C C C CCAGAGGGC C AGAAGCT C C GGGCT GGGAC C C GG 

1330 1340 1350 1360 1370 1380 

1370 1380 1390 1400 1410 1420 

Hn54 0-1 . Dna GTGAGGCTGGTATGCTTGGCCATCGGAGGCAACCCAGACCCCTCCCTCATCTGGTTTAAG 

I I I I I I I I I I I M INN 11)11 I II I II II II I II I II I II I II I II I III 
Af 0 358 35 GTGAGGCTGGTGTGTTTGGCTATCGGGGGCAACCCAGAGCCCTCCCTCATGTGGTACAAG 

1390 1400 1410 1420 1430 1440 

1430 1440 1450 1460 1470 1480 

Hn5 4 0- 1 . Dna GAT T CAC GT C C GGT GAGC GAGC C C C GGC AGC C C C AGGAGC C C C GGC GT GT GC AGC T GGGC 

II II II I MM MM I MM II I II II II I I I II I II II I M III 
Af 0 3 5 8 3 5 GACTCGCGCACCGTGACCGAGTCGCGGCTGCCGCAGGAGTCGCGGCGCGT GCATCTCGGC 

1450 1460 1470 1480 1490 1500 

1490 1500 1510 1520 1530 1540 

Hn540- 1 . Dna AGT GT GGAGAAGT CC GGGAGC ACT T T CT C C C GC GAGC T GGT GTT GAT C AT AGGT C C GC C G 
II M M I I .11 M I I I M II I M II I I II M I II II II II M I III III II 
Af 0 3 5 8 3 5 AGCGTGGAGAAATCTGGGAGCACCTTCTCCCGAGAGCTGGTGCTGGT CACAGGGCCGTCG 

1510 1520 153Q 1540 1550 1560 

1550 1560 1570 1580 1590 1600 

Hn54 0-1 . Dna GACAACCGAGCCAAGTTCTCCTGCAAGGCGGGTCAGCTCAGTGCGTCTACGCAGCTGGTG 
M II I I I I I I I I I I II I II II II II II II I II i II I I I M ! E II II I II I I 
Af 0 3 5 8 3 5 GACAACCAGGCCAAGTTCACGTGCAAGGCTGGACAGCTCAGCGCGTCCACGCAGCTGGCG 

1570 1580 1590 1600- 1610 1620 

1610 1620 1630 1640 1650 1660 

Hn5 4 0-1 . Dna GTGCAGTTCCCCCCAACCAACCTGACCATCCTGGCCAACTCGTCCGCGCTGCGCCCAGGC 

IN II I II I i I Ml MM II I II I II II II I I I M ! I I II II II II 

Af 0358 3 5 GTGCAGTTTCCCCCAACTAACGTGACGATCCTGGCCAACGCATCCGCACTGCGCCCGGGA 

1630 1640 1650 1660 1670 1680 



1670 1680 1690 1700 1710 1720 

Hn540-1 . Dna GAC GC C T T GAACT T GAC C T GC GT CAGCAT C AGCAGCAAC C C C C CAG^ C AACT T GT C T T GG 

MINIM M M II I I II I II II II M II II I II I II II M I I II II I I I III 

Af 0 3 5 8 3 5 GACGCCTTAAACTTGACATGCGTCAGCGTCAGCAGCAATCCGCC GGT CAACTTGTCCTGG 

1690 1700 1710 1720 1730 1740 

1730 1740 1750 1760 1770 1780 

Hn54 0- 1 . Dna GACAAGGAAGGAGAGAGGCTGGAAGATGTGGCTGCAAAACCCCAGAGTGCACCGTTCAAA 
n# " MC I II I II I I II I II I M I I 1 II I I II II I II I I I II III II II I I I I | I 

Af 0 3 5 8 3 5 GACAAGGAAGGGGAGAGGCTGGAGGGCGT GGCC GC CC CACC CC GGAGAGC CC C ATTCAAA 

1750 1760 1770 1780 1790 1800 

1790 1800 1810 1820 1830 1840 
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C T G C AT C C AG G AGT GT T T T T C T C AGAGT (SBPr C 



Hn540-1 - Dna GGC^MK?CT GC AT C CAGGAGT GT T T T T C T C AGAGT C^KT C CC GAGAC CAC GGT C AAC GC 
i I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I 

Af 035 8 35 GGCTCCGCCGCCGCCAGGAGCGTCCTTCTGCAAGTGTCATCCCGCGATCATGGCCAGCGC 

1810 1820 1830 1840 1850 1860 

1850 1860 1870 1880 1890 1900 

Hn540-1 . Dna GTCACCTGCCGGGCCCACAGCGAGGCACTCCGTGAAACCGTGAGCTCCTTCTACCGCTTC 
II I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I ! I I IN I i 

Af 035 835 GTGACCTGCCGCGCCCACAGCGCCGAGCTCCGCGAAACCGTGAGCTCCTTCTATCGCCTC 

1870 1880 1890 ' 1900 1910 1920 

1910 1920 1930 1940 1950 1960 

Hn540-1 . Dna AAT GT GCT GT AT C CT C CAGAAT T C CTGGGGGAGCAAGT CCGGGCAGT GACC GT GGT GGAG 
II I I I I I I I I Mill! I I I I I I I I I I I I I I II I i I I I I I I I I I II I I I I 
Af 0 35835 AAC GTAC T GTAC C GTCCAGAGTTCCTGGGGGAGCAGGT GCT GGT GGT GACCGC GGT GGAG 

1930 1940 1950 1960 1970 1980 

1970 1980 1990 2000 2010 2020 

Hn540-1 . Dna CAGGGCCAGGTGCTGCTGCCGGTGTCGGTGTCCGCTAACCCCGCCCCCGAGGCCTTCAAC 

I I I I I I IN I I I I I I I I Mill I M I I I I I ! I I I I I I I I I I I I I I I I I I I i I I I I 

Af 035835 CAGGGCGAGGCGTTGCTGCCCGT GTCCGTGTCCGCTAACCCCGCCCCCGAGGCCTTCAAC 

1990 2000 2010 2020 2030 2040 

2030 2040 2050 2060 2070 2080 

Hn54 0-1 . Dna TGGACCTTCCGAGGCTACCGCCTCAGCCCAGCTGGGGGTCCCCGGCACCGTATCCTGTCT 

I I I I I I I I 11 I Mill I I! I I I II I I I II M II I I M I I II II II I M I II 
Af 0 358 35 TGGACCTTCCGCGGCTATCGCCTCAGTCCAGCGGGCGGCCCCCGGCATCGCATCCTGTCC 

2050 2060 2070 2080 2090 2100 

2090 2100 2110 2120 2130 2140 

Hn54 0-1 . Dna GGAGGGGCTCTGCAGCTGTGGAATGTGACCCGAGCTGACGATGGCTTTTATCAGCTGCAC 
I I I I I M II M I I I I II II II I II I I II I M Mill III I II I I I i I I I I II 
Af 0358 35 AGCGGGGCTCTGCATCTGTGGAATGTGACCCGCGCGGACGACGGCCTCTAT CAGCTGCAC 

2110 2120 2130 2140 2150 2160 

2150 2160 2170 2180 2190 2200 

Hn540^ 1 . Dna TGCCAGAACTCAGAGGGCACCGCTGAGGCGCTGTTGAAGCTGGACGT GCATTATGCTCCC 

II M I II I I I I I II II M I II I II MM I II 1 M I I II I M I I M I I M I I 1 

Af 0 3 5 8 3 5 TGCCAGAACTCTGAGGGCACCGCGGAAGCGCGGCTGCGGCTGGACGTGCACTATGCTCCC 

2170 2180 2190 2200 - 2210 2220 



2210 2220 2230 2240 2250 2260 

Hn54 0-1 . Dna ACCATCCGTGCCCTCCGGGACCCTACTGAGGTGAATGTTGGGGGTTCTGTGGACATAGTC 
II I M II I II II I I II Mill! I II II I II II I M i I II I M II I II I II M I I II 

Af 0358 35 AC CAT C C GT GC C C T C C AGGAC C C CAC T GAGGT GAAC GT C GGGGGT T C T GT GGAC AT AGT C 

2230 ' 2240 2250 2260 2270 2280 

2270 2280 2290 2300 2310 2320 

Hn5 40-1 . Dna T GC AC C GT T GAC GC CAAT C C CAT C CT C C C AGAGAT GT T C AGC T GGGAGAGACT GGGAGAA 
Mill i i I I M I i I M I! II M i I I I I M II I II I II II M II I II M I II I I 
Af 0358 3 5 T GCACT GT CGAT GC CAAT C CC AT CCT CC C GGGCAT GT TCAACT GGGAGAGACT GGGAGAA 

2290 2300 2310 2320 2330 2340 

2330 2340 2350 2360 2370 2380 

Hn540-1 . Dna GAAGAGGAGGATCT GAACCT GGACGACAT GGAGAAAGTTT CCAAGGGATCCACGGGGCGT 

M I II I I II I I II Mill! I II II I I II I I I Mil I I I I I I II M I i I 
Af 03 5 8 3 5 GAT GAGGAGGAC C AGAGC C T GGAT GAC AT GGAGAAGAT AT C C AGGGGAC CAAC GGGGC GC 

2350 2360 2370 2380 2390 2400 

2390 2400 2410 2420 2430 2440 

Hn540- 1 . Dna C T G C GGAT T C GC CAAGC C AAGCT AT C C CAGGC T GGT GC CT AC C AGT GC AT C GT GGAC AAT 
I I I I I I II M I M Mill II II II II M I I II I 11 M II II I I I I II II I II 

Af 0358 35 CT GC GGAT T C AC C AT GC CAAAC T GGC C C AGGC T GGC GCT T AC C AGT GC AT TGT GGAC AAT 
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2450 2460 



2450 2460 2470 2480 2490 2500 

Hn54 0-1 . Dna GGGGTGGCTCCTGCAGCCAGAGGACTGGTTCGTCTTGTCGTCCGATTTGCTCCCCAGGTG 

I I I I I I I I III MM M 1 Ml I M M M M I M M M M I M M M M I 

Af03 58 35 GGGGTGGCGCCTCCAGCACGACGGCTGCTCCGTCTTGTTGTCAGATTTGCCCCCCAGGTG 

2470 2480 2490 2500 2510 2520 

2510 2520 2530 2540 2550 2560 

Hn5 40-1 . Dna GATCAGCCTACTCCCCTAACAAAAGTGGCTGCCGCTGGGGACAGCACCAGCTCAGCCACA 

M II M M M M I M M M I M M M I I I M I M I M M M M I I Mill 

Af 03 5835 GAGCACCCCACTCCCCTAACTAAGGTGGCTGCAGCTGGAGACAGCACCAGTTCTGCCACC 

2530 2540 2550 2560 2570 2580 

2570 2580 2590 2600 2610 2620 

Hn540-1 . Dna CTGCACTGCCGTGCCCGGGGTGTCCCCAACATCGACTTCACTTGGACCAAAAACGGGGTC 

II M I M I II I M I II I II I II I I M I I I M I II I I I II I II I ! I I I II II M I I 
Af 035835 CTCCACTGCCGTGCCCGAGGTGTCCCCAACATCGTTTTCACTTGGACAAAAAACGGGGTC 

2590 2600 2610 2620 2630 2640 

2630 2640 2650 2660 2670 2680 

Hn540-1 . Dna C CT CT GGAT CT C CAAGACCC CAGGTACACAGAGCACAGGT AC CACC AGGGT GTT GT CC AC 
I II I I I I II I I I I I II I I I II I I II I II II I II I I M II II II II M I I ! I II II 
Af 035 8 35 C C T C T GGAT CT C CAAGAT C C C AGGT ACAC GGAGCAC ACAT AC C AC C AGGGT GGT GT C C AC 

2650 2660 2670 2680 2690 2700 

2690 2700 2710 2720 2730 2740 

Hn5 4 0-1 . Dna AGCAGCCTCTTGACCATCGCTAATGTGTCTGCGGCCCAGGACTATGCCCTCTTCAAATGC 

I M I I II I I I I I I M I 11 II II I II II I M I I II I I II I II II II I M M ! 
Af 035 8 35 AGCAGCCTCCTGACCATTGCCAACGTGTCTGCCGCCCAGGATTACGCCCTCTTCACATGT 

2710 2720 2730 2740 2750 2760 



2750 2760 2770 2780 2790 2800 

Hn54 0-1 . Dna ACGGCCACCAATGCCCTTGGCTCTGACCACACCAACATCCAGCTCGTCAGCAT CAGCCGC 

II II M II I I I II I I M I II I Mill I II II M I II II I I I I I M I I I I M I I 

Af 035 835 ACAGCCACCAACGCCCTTGGCTCGGACCAAACCAACATTCAACTTGTCAGCATCAGCCGC 

2770 2780 279p 2800 2810 2820 

2810 2820 2830 2840 2850 2860 

Hn54 0-1 . Dna CCTGACCCTCCACTGGGACTGAAGGTTGT CAGCATAAGCCCTCACTCGGTGGGGCTGGAG 
I II I I II M M I III I II II I I II II I I II! Mill I M I I II M M I 
Af 035 8 35 CCTGACCCTCCATCAGGATTAAAGGTTGTGAGTCTGACCCCACACTCCGTGGGGCTGGAG 

2830 2840 2850 2860 2870 2880 

2870 2880 2890 2900 2910 2920 

Hn54 0-1 . Dna TGGAAGCCTGGCTTTGATGGGGGTCTGCCTCAGAGGTTCCAAATCAGGTACGAGGCCCTC 

I II I II I I 1 I II II I M I I II II Mill M II I I M I II I II I II II I M II 1 

Af 03 58 35 TGGAAGCCTGGCTTTGATGGGGGCCTGCCACAGAGGTTCTGCATCAGGTATGAGGCCCTG 

2890 2900 2910 2920 2930 2940 

2930 2940 2950 2960 2970. 2980 

Hn540-1 . Dna GAGAC C CC AGGAT T C C T C C AC GT GGAT GT C CT AC C T ACAC AGGC C AC T AC C TT C AC GC T G 
! Ml IMM II II I I II II II II I MM I II M I II I II M II II II I I 

Af 0 3 5 8 3 5 GGGACTCCAGGGTTCCACTATGTGGATGTCGTACCACCCCAGGCCACCACCTTCACGCTG 

2950 2960 2970 2980 2990 3000 

2990 3000 ' 3010 3020 3030 3040 

Hn540-1 . Dna ACT GGGCT GAAGCCT T CT ACAC GAT AT AGGAT CTGGCTGTTGGCCAGCAATGCCCTGGGG 
MMI II I II II II II I I MM III M II II II I II I I II II II I I II II I 
Af 0 3 5 8 3 5 ACTGGTCTACAGCCTTCTACAAGATACAGGGTCTGGCTGCTGGCCAGTAATGCCTTGGGG 

3010 3020 3030 3040 3050 3060 

3050 3060 3070 .3080 3090 3100 

Hn540-1 . Dna GACAGTGGATTGACGGACAAGGGGATCCAGGTCTCCGTCACTACCCCAGGCCCCGACCAG 
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I 1 I Wm\ I II I Mill MM INI I I I I I M M I M I I M M I 

Af 0 3 5 8 3 5 GACAGTGGACTGGCTGACAAAGGGACCCAGCTTCCCATCACTACCCCAGGTCTCCACCAG 

3070 3080 3090 3100 3110 3120 

3110 3120 3130 3140 3150 3160 

Hn5.40-1 . Dna GCTCCTGAAGACACAGACCACCAGCTGCCCACAGAGCTGCCTCCAGGACCCCCAAGGCTG 
I I MINI I I I M M M M M M M I I M Mi I I I I I I I I I Mill 

Af.0358 35 CCTTCTGGAGAACCTGAAGACCAGCTGCCCACAGAGCCACCTTCAGGACCCTCGGGGCTG 

3130 3140 3150 3160 3170 3180 

3170 3180 3190 3200 3210 3220 

Hn540-1 . Dna CCGCTGCTGCCTGTGCTCTTTGCAGTTGGTGGTCTTCTGCTGCTCTCCAATGCCTCCTGT 
M M I M M M M M I 1 M II MM M M M M M I M M M I M M M M M 
Af 035835 CCCCTGCTGCCTGTGCTGTTCGCTCTTGGGGGGCTTCTGCTCCTCTCCAATGCCTCCTGT 

3190 3200 3210 3220 3230 3240 

3230 3240 3250 3260 3270 3280 

Hn540-1 . Dna GTTGGGGGTCTCCTCTGGCGGAGAAGACTGAGGCGCCTTGCTGAGGAGATCTCAGAGAAG 

II Mill II I I II I II I I II I I I II M I M M I I II I I I M I I I I I M M 

Af 0 3 5 8 3 5 GTCGGGGGGGTCCTCTGGCAGCGGAGACTCAGGCGTCTTGCTGAGGGCATCTGAGAGAAG 

3250 3260 3270 3280 3290 3300 



3290 3300 3310 3320 3330 3340 

Hn 5 4 0 - 1 . Dna ACAGAGGCAGGGTCGGAGGACAGGATCAGGAATGAATATGAGGAGAGTCAGTGGACT 
I II I I M II i I I I I I II M II I M I I I I I I I II II II M I I I I M I I II I I 

Af 0 3 5 8 3 5 AC AGAGGCAGGGT C GGAAGAGGAC C GAGT CAGGAAC GAAT AT GAGGAGAGC C AGT GGAC A 

3310 3320 3330 3340 3350 3360 

3350 3360 3370 3380 3390 3400 

Hn540-1 . Dna GGGGACCGGGACACGAGAAGCTCCACGGTTAGCACAGCAGAAGTGGACCCAAATTACTAC 
II II I M I I II I I I II M M II I I i I I I I I M I I M I I Mill I 
Af 0 3 5 3 3 5 GGAGAGCGGGACACT CAGAGCT CCACGGT CAGCACAACAGAGGCAGAGC C GT AT TACCGC 



3370 33.80 3390 3400 3410 3420 

3410 . 3420 3430 3440 3450 3460 

Hn54 0-1 . Dna TCCATGAGGGACTTCAGCCCCCAGCTTCCCCCAACACTGGAGGAGGTGCTGTAT CACCAA 
III II II I II I II I I I M II I I I I I I M II II I I II II I I I II III II I 
Af 03 58 3 5 TCCCTGAGGGACTTCAGCCCCCAGCTGCCCCCGACGCAGGAGGAGGTGTCTTATTCCCGA 

3430 3440 3450 3460 3470 3480 



3470 3480 3490 3500 3510 3520 

Hn5 4 0-1 . Dna GGT GCT GAAGGCGAGGAC AT GGCCT T C C C CGGACACCT GCAT GAT GAAGT GGAGAGAGC C 
II I II I II II 

Af 0 3 5 3 3 5 GGTTTCACAGGTGAAGATGAGGATATGGCCTTCCCTGGGCACTTGTATGATGAGGTAGAA 

3490 3500 3510 3520 3530 3540 



Hn540-l.Dna 
Gcg_Geneseq_D: Z25338 

ID Z25338 standard; cDNA; 4285 BP. 

AC Z25338; 

DT 17-DEC-1999 (first entry) 

DE Human nephrin nucleotide sequence. 

KW Human; nephrin; NPHS1 gene; basement membrane disease; proteinuria; 

KW nephrotic syndrome; kidney disease; diagnosis; clinical nephrology; 

KW glomerular filtration barrier; glomerulonephritis; ss . 

OS Homo sapiens. 

FH Key Location/Qualifiers 

FT CDS 1. .3726 

FT /*tag= a 



FT sig__peptide 1. .66 

FT ' /*tag= b 

FT /note= "putative signal peptide" 

FT mat_peptide 67. .3723 
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FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
PN 
PD 
PF 
PR 

PA 
PI 
DR 
DR 
PT 
PT 
PS 
CC 
CC 
CC 
CC 
CC 

CC 
CC 
CC 
CC 
CC 
CC 
CC 
CC 
SQ 



FT 

misc feature 



misc feature 



misc feature 



W09947562-A1. 
23-SEP-1999 . 
16-MAR-1999; 
18-MAR-1998; 



[EDITOR- [540-4 . LOG] ] 



17.10.2000/13:57:35 



/*tag= c 
121. .122 
/*tag= d 

/note= "deletion mutation FIN-Major" 
3800. .3804 
/*tag= e 

/note= "nonsense mutation in exon 26 FIN-Major" 
3178. .3258 
/*tag= f 

/note= "putative transmembrane domain" 



U05578 . 
US-040774, 



(BIOS-) BIOSTRATUM INC. 

Tryggvason K, Kestila M, Lenkkeri U, Mannikko M; 
WPI; 19 99-5 909 67/50. 
P-PSDB; Y 42167. 

New isolated nucleic acid (gene) encoding nephrin useful in methods for 
screening for susceptibility to basement membrane disease - 
Claim 1; Page 34-42; 60pp; English. 

The present sequence represents the NPHS1 gene which encodes nephrin. 
The present invention describes methods for the treatment of an 
individual with basement membrane disease by administration of the 
nephrin protein, as well as methods of gene therapy using therapeutic 
nucleic acid constructs containing an expressible nucleic acid with 

the NPHS1 sequence. NPHS1 appears to solely affect the kidney and 
therefore provides a unique model for studies on the glomerular 
filtration barrier. Abnormal function of the filtration barrier is a 
major complication in many clinically important kidney diseases such as 
nephrotic syndromes and glomerulonephritides and therefore this 
invention will help in the understanding of clinical nephrology. 
The identification of the NPHS1 gene immediately finds applications 
for diagnosis of the disease. 

Sequence 4285 BP; ' 886 A; 1294 C; 1302 G; 803 T; 



SCORES Initl: 11557 Initn: 12214 Opt: 12066 z-score: 17125.7 E(): 

83.1% identity in 3474 bp overlap 

10 20 30 40 

Hn540-1 . Dna ATGTCCAGTTTGACTCCCCTGCTGCTCATGGGAATGCTGACCTCAGGC 

I II I It Mi I I I I I II MM 

Z2533 8 ATGGCCCTGGGGACGACGCTCAGGGCTTCTCTCCTGCTCCTGGGGCTGCTGACTGAAGGC 

10 20 30 40 50 60 



50 60 70 80 90 100 

Hn5 4 0-1 . Dna CTGGCCGAGTCGCCAGTCCCCACCTCAGCACCTCGAGGCTTCTGGGCTCTGTCTGAAAAC 
M M I Ml I I I I I I I I I i II II I I II II II I II Mi I M I I II I 



Z25338 



CTGGCGCAGTTGGCGATTCCTGCCTCCGTTCCCCGGGGCTTCTGGGCCCTGCCTGAAAAC 
70 80 90 100 ' 110 120 



110 120 130 140 150 160 

Hn540-1 . Dna CTGACTGCGGTGGAAGGGACAACAGTTAAGCTATGGTGCGGTGTCAGGGCCCCTGGCAGT 
I II M I I I I I I I III I . MM II I I I II II Mill I I M II I I I M 
Z2 5 3 3 8 CTGACGGTGGTGGAGGGGGCCTCAGTGGAGCTGCGTTGTGGGGTCAGCACCCCTGGCAGT 

130 140 150 160 170 180 



170 180 190 200 210 220 

Hn54 0-1 . Dna GTGGTGCAGTGGGCTAAGGATGGGCTGCTTCTGGGTCCAAACCCGAAGATGCCAGGCTTC 

I I M I II Mill II I II I I M M II I I II I II MM I III II II I M M 

Z25 33 8 GC GGT GC AAT GGGCC AAAGAT GGGCT GCT CCT GGGC CC C GACC C CAGGAT C C C AGGCT T C 

190 200 210 220 230 240 
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230 240 250 260 ^^270 280 

Hn540-1 . Dna CCGAGGTACAGCCTGGAAGGAGATCGTGCTAAAGGCGAGTTCCACCTGCTTATTGAAGCC 
I I I I I I I I I I I I I I I I I I I I I I Mill II! II I I I I I I I I I I I! II III 
Z 2 5 3 3 8 CCGAGGTACCGCCTGGAAGGGGACCCTGCTAGAGGTGAATTCCACCTGCACATCGAGGCC 

250 260 270 280 290 300 

290 300 310 320 330 340 

Hn540-1 . Dna T GT GAC CT CAGT GAT GAC GC AGAGT AT GAAT GC CAAGT C GGC C GCT C AGAGT T GGGT C C C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III I I I I III 
Z25 338 TGTGACCTCAGCGATGACGCGGAGTATGAGTGCCAGGTCGGCCGCTCTGAGATGGGGCCC 

310 320 330 340 350 360 

350 360 370 380 390 400 

Hn540-1 . Dna GAGCTTGTGTCTCCTAAAGTAATCCTCTCCATTCTAGTTTCCCCCAAGGTGCTTCTGTTG 
I I I I I I I I I I I I I I III I I I I I I I II I I I I III I ! I I I I I I I I I III II 
Z2 533 8 GAGCTCGTGTCTCCCAGAGTGATCCTCTCCATCCTGGTTCCTCCCAAGCTGCTCCTGCTG 

370 380 390 400 410 420 



410 420 430 440 450 460 

Hn540-1 . Dna AC CCC CGAGGCAGGAAGCACAGT GACCT GGGT AGCT GGGCAGGAGT AT GT GGT CACCT GT 
I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 
Z 2 5 3 3 8 ACCCCAGAGGCAGGCAC CAT GGT CACCT GGGT AGCT GGGCAGGAGT AC GT GGT CAACTGT 

430 440 450 460 470 480 

470 480 490 500 510 520 

Hn5 4 0- 1 . Dna GT GT CT GGGGAT GC AAAAC C AGC AC CT GAC AT C AC CT T CAT C C AGAGT GGAC GAACT AT A 
I I I I I I I I I I I II II I I I II I I I I I 1 I I I I ! I I I III I I I I I I I I I i Mi 
Z25338 GT GT C T GGGGAC GC GAAGC CAGC AC CT GAC AT C AC CAT T CT C C T GAGT GGAC AGAC AAT A 

490 500 510 520 530 540 

530 540 550 560 570 580 

Hn540-1 . Dna TTGGAC GT CT CCT CCAAT GTGAAT GAGGGAT C AGAGGAGAAACT CT GCAT CAC AGAGGCC 
I I I I I I I I I I i i I I I I I I I I I I I I I I I I I I I I I 1 I I I i I I II 

Z2 533 8 TCTGACATCTCTGCAAACGTGAACGAGGGCTCCCAGCAGAAACTCTTCACTGTGGAGGCC 

550 560 570 580 590 600 

590 600 610 620 630 640 

Hn54 0-1 .Dna GAAGCCAGGGTGATACCCCAGAGCTCGGATAACGGGCAGTTACTGGTCTGTGAGGGTTCC 

I I I M I I I I I I Mill I I I II I MM) I I I I I M i ! I I II II II M I II 

Z2 533 8 ACAGCCAGGGTGACACCCCGGAGCTCAGATAATAGGCAGTTGCTGGTCTGTGAGGCGTCT 

610 620 630 640 650 660 

650 660 670 680 690 700 

Hn540-1 . Dna AAC C C AGCT T T GGAC AC T C C CAT AAAGGC T T C ATT CAC CAT GAAT AT T C T GT T T C C C C C A 
I I I I I I I MM I II I I I I M I I M I II II M I I II I II II I II M Ml 
Z2 53 38 AGCC CAGCACTGGAGGCCCCCATCAAGGCCTCATTCACCGT GAAT GTTCTGTTC CCT CCA 

670 680 690 700 710 720 

710 720 730 740 750 760 

Hn540-1 . Dna GGAC CT C CT GT C ATT GATT GGC CAGGC CT GAAT GAAGGGCAT GT GAGGGC AGGGGAGAAC 

Mill II I I I I! I II M I I I II I M II MM Mill Ml 1 I M I i I - M I i 
Z25338 GGACCCCCTGT CATC GAGT GGC CAGGCCTGGATGAGGGGCACGTGCGGGCAGGACAGAGC 

730 740 750 760 770 780 

770 780 790 800 810 820 

Hn54 0-1 . Dna CTGGAGCTGCCCTGCACAGCCAGAGGTGGCAATCCACCTGCTACCCTGCAGTGGCTGAAG 

II II M I II I III Ml I II I M Mill M M M I if M I I II M I I 

Z 2 5 3 3 8 TTGGAGCTGCCGTGCGT GGC CCGAGGGGGT AAT CCCTT AGC CACACTGCAGTGGCTGAAG 

790 800 810 820 830 840 

830 840 850 860 870 880 

Hn5 4 0- 1 . Dna AAC GGT AAAC CAGT GT C CAC AGC CT GGGGC AC C GAG C AT GC C C AGGC AGT GGC C CACAGT 
I I II I M I M M I I M M I II I I II I II I II I I I I i II I I I M I I II I I 
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.t^BRagccggtgtccacagcgtggggcacaga^R/ 



Z2 53 3 3 AAT^BPCAGCCGGTGTCCACAGCGTGGGGCACAGA^^ACCCAGGCGGTGGCCCGCAGT 

850 860 870 880 890 ' 900 

890 900 910 920 930 940 

HH540-1 . Dna GTGCTGGTGATGACTGTACGACCTGAAGACCATGGAGCTCGGCTCAGCTGTCAGTCCTAC 
I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I MINIMI II II II 
Z2 53 38 GT GC T GGT GAT GAC C GT GAGGC C AGAAGAC CAT GGAGC GCAGCT CAGC T GC GAGGC C C AC 

910 920 930 940 950 960 



950 960 970 980 990 1000 

Hn5 4 0- 1 . Dna AAC AGC GT GT CT GCAGGGACCCAGGAGAGAAGC ATCACACT ACAGGT CAC CTT T C C C CCA 

I I I I I M II I I I I I I I I I II I I M I I I I I I I 1 I I I I I I I I I I I I I I I I I I I II I 

Z2533 8 AAC AGC GT GT CT GC AGGGAC C C AGGAGC AC GGC AT CAC AC T GC AGGT CAC CTTTCCCCCT 

970 980 990 1000 1010 1020 

1010 1020 1030 1040 1050 1060 

Hn540-1 . Dna AGC GC CAT T AC CAT C CT GGGAT C T GT AT C ACAAT C GGAGAAC AAGAAC GT GAC C CT T T GC 
I I ' I I I I I I I I M I I I I I I I I I 111 II I I I I I I I I I I I II I I I I I I I I I 
Z253 38 AGT GC C AT TAT TAT CTT GGGAT C TGC AT C C C AGACT GAGAACAAGAAC GT GAC ACT CT C C 

1030 1040 1050 1060 1070 1080 

.1070 1080 1090 1100 1110 1120 

Hn54 0-1 . Dna TGCCTGACCAAGTCCAGTCGCCCACGGGTCCTGCTGCGATGGTGGTTGGGTGGACGGCAG 
I I I I I II I I M I I I I I I I I I I I I I IMII I I I I I I I I I I I I I I MINI 
Z2 5338 TGT GTCAGCAAGTCCAGTCGCCCGCGGGTTCTGCTACGATGGTGGCTGGGCTGGCGGCAG 

1090 1100 1110 1120 1130 1140 

1130 1140 1150 1160 1170 1180 

Hn540-1 . Dna CT GCT GCC CACAGAT GAGACAGT CAT GGAT GGCCT GCAT GGTGGCCACAT CT C CAT GT C C 

I I I II I I I I I II I I I I I I I I I I I I I I I I I MINIM II II II I M I I I II I I i 

Z25338 CTGCTGCC CAT GGAGGAGAC AGT CAT GGAT GGAC T GCAT GGC GGT CAC AT CT C CAT GT C C 

1150 1160 1170 1180 1190 1200 

1190 1200 1210 1220 1230 1240 

Hn5 4 0-1 . Dna AATCTCACATTCTTGGTGCGGAGAGAAGACAATGGCCTGCCCCTCACGTGTGAAGCCTTC 
! I II NNN III II II I 11 INN II III I I II II I I I M I I I 11 II 
Z2533 8 AAC CTGACATTCCT GGC GCGGCGGGAGGACAAC GGT CT GAC CCTCACATGT GAGGC CTT C 

1210 1220 1230 1240 1250 1260 

1250 1260 1270 1280 1290 1300 

Hn540-1 . Dna AGT GAC GC CT T C AG CAAGGAGAC CTT CAAGAAGT CAC T C AC CT T GAAT GT GAAAT AC C C T 

II I I I N II II I I I I I I I I I I 1 I I I I | I I | | I | NN | Nil I I | | I I I II 

Z 2 5 3 3 8 AGT GAAGC CT T CAC CAAGGAGAC CT T CAAGAAGT C GCT CAT C C T GAAC GT AAAAT AT C C C 

1270 1280 1290 1300 1310 1320 

1310 1320 1330 1340 1350 1360 

Hn540-1 . Dna GCC C AGAAGCT GT GGATT GAGGGGC C C CCAGAG GGAC AGT ACAT C C GGACT GGGACT CGG 
I I II I I I I I It II N II I I N I I I I i II I 11 II III i INN s I I I I II III 
Z2 5 3 3 8 GCCCAGAAACTGTGGATTGAGGGTCCCCCAGAGGGCCAGAAGCTCCGGGCTGGGACCCGG 

1330 1340 1350 1360 1370 1380 

1370 1380 1390 1400 1410 1420 

Hn540-1 . Dna GT GAGGC T GGTAT GCT T GGC CAT CGGAGGCAACCCAGACCCCTCCCT CAT CT GGT TTAAG 
I N I II II I II II I I I II I II I I I I II || II II I I I i I I I I I I I I II I I III 
Z2 5338 GTGAGGCTGGTGTGTTTGGCTATCGGGGGCAACCCAGAGCCCTCCCTCATGTGGTACAAG 

1390 1400 1410 1420 1430 1440 

1430 1440 1450 1460 1470 1480 

Hn5 4 0-1. Dna GATTCACGTCCGGTGAGCGAGCCCCGGCAGCCCCAGGAGCCCCGGCGTGTGCAGCTGGGC 
I I II II I N I I I II I I Nil III I II II I I I I I II Mill II III 
Z25338 GA.CTCGCGCACCGTGACCGAGTCGCGGCTGCCGCAGGAGTCGCGGCGCGTGCATCTCGGC 

1450 1460 1470 1480 1490 1500 
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Hn540-1 .Dna 



Z25338 



1490 1^00 1510 1520 ^P30 1540 

AGTGTGGAGAAGTCCGGGAGCACTTTCTCCCGCGAGCTGGTGTTGATCATAGGTCCGCCG 

II I II I II M II I I I I I I I I I I I I I I I I I I I II I I I I I I Ml I I I I i I II 
AGCGTGGAGAAATCTGGGAGCACCTTCTCCCGAGAGCTGGTGCTGGTCACAGGGCCGTCG 
1510 1520 1530 1540 1550 1560 



1550 1560 1570 1580 1590 1600 

Hn540-1 . Dna GACAAC C GAGC CAAGTT CT C C T GCAAGGCGGGT CAGCT CAGT GCGT CT ACGCAGCT GGT G 
I II I I I I I I I I I I I I I I -MINIM II I I II I I I I I I II I I II I I I I i I I I 
Z25338 GACAAC CAGGC CAAGT TC AC GTGCAAGGCTGGACAGCTCAGCGCGTCC AC GCAGCTGGCG 



1570 



1580 



1590 



1600 



1610 



1620 



1610 1620 1630 1640 . 1650 1660 

Hn540-1 . Dna GTGCAGTTCCCCCCAACCAACCTGACCATCCTGGCCAACTCGTCCGCGCTGCGCCCAGGC 

II I I I I I.I I I I I I I II III I I II I I I I I II II I II I Mill I II I I I I I II 
Z 2 5 3 3 8 GTGCAGTTTCCCCCAACTAACGTGACGATCCTGGCCAACGCATCCGCACTGCGCCCGGGA 

1630 1640 1650 1660 1670 1680 

1670 1680 1690 1700 1710 1720 

Hn54 0-1 . Dna GAC GC C T T GAAC T T GAC CT GC GT C AGCAT CAGC AGC AAC C C C C CAGT C AACT T GT CT T GG 
II II I I II I I I I I I I I I I I I I I II I I I I II I II I I II ! I I I I I II I I I I I 11 I 



Z25338 



GACGCCTTAAACTTGACATGCGTCAGCGTCAGCAGCAATCCGCCGGT CAACTTGTCCT GG 
1690 1700 1710 1720 1730 1740 



1730 1740 1750 1760 1770 1780 

Hn540-1 . Dna GACAAGGAAGGAGAGAGGCTGGAAGAT GT GGCT GCAAAACC C C AGAGT GCACCGTTCAAA 
! I I II I I I I I I II II I I II I II I I I II I II Mill Ml II II MINI 
Z2 5 3 3 3 GACAAGGAAGGGGAGAGGC T GGAGGGC GT GGC C GC C C CAC C C CGGAGAGC C C CAT T C AAA 

1750 1760 1770 1780 1790 1800 

1790 1800 1810 1820 1830 1840 

Hn5 4 0- 1 . Dna GGC T C C GC T GC AT C C AGGAGT GTT T T T C T C AGAGT GT CAT C C C GAGAC CAC GGT C AAC GG 



Z25338 



M M I II I M I II II II I I MM M II II I M II I I! M M II I I 
GGCT CCGCCGCCGCCAGGAGCGTCCTTCTGCAAGTGT CAT CCCGC GAT CAT GGC CAGC GC 
1810 1820 1830 1840 1850 1860 



1850 1860 1870 1880 1890 1900 

Hn5 4 0-1 . Dna GTCACCTGCCGGGCCCACAGCGAGGCACTCCGTGAAACCGTGAGCTCCTTCTACCGCTTC 

M II II II II I M II II I II I MM! I I I II I I I I M II I I M M I III II 
Z2 5338 GTGACCTGCCGCGCCCACAGCGCCGAGCTCCGCGAAACCGTGAGCTCCTTCTATCGCCTC 

1870 1880 1890 1900 1910 1920 



1910 



1920 



1930 



1940 



1950 



1960 



Hn540-1 . Dna 



Z25338 



AAT GTGCT GT AT CCT CC AGAAT T CC T GGGGGAGCAAGT C C GGGC AGT GA.C C GT GGT GGA.G 
11 M I II II I I II I I I I i M II I I I M II I II I II I II II I I M II I I I 
AACGT AC T GT AC C GT C CAGAGTT C CT GGGGGAGCAGGT GCT GGT GGT GAC C GC GGT GGAG 
1930 1940 1950 1960 1970 1980 



1970 1980 1990 2000 2010 2020 

Hn54 0-1 . Dna CAGGGCCAGGTGCTGCTGCCGGTGTCGGTGTCCGCTAACCCCGCCCCCGAGGCCTTCAAC 
M II I I III I II II I I I I I I II II I II M I I II I II I II I II M II I I II II I I I 
Z2 5 3 3 8 CAGGGCGAGGCGTTGCTGCCCGTGTCCGTGTCCGCTAACCCCGCCCCCGAGGCCTTCAAC 

1990 2000 2010 2020 2030 2040 

2030 2040 2050 2060 2070 2080 

Hn540-1 . Dna TGGACCTTCCGAGGCTACCGCCTCAGCCCAGCTGGGGGTCCCCGGCACCGTATCCTGTCT 

I I I I I I I I I I I Mill II II M II Mill II M M I M 11 I II I I II I M I 
Z 2 5 3 3 8 TGGACCTTCCGCGGCTATCGCCTCAGTCCAGCGGGCGGCCCCCGGCATCGCATCCTGTCC 

2050 2060 2070 2080 2090 2100 



2090 2100 2110 2120 2130 2140 

Hn540-1 . Dna GGAGGGGCTCTGCAGCTGTGGAATGTGACCCGAGCT GAC GAT GGCTTTTAT CAGCT GC AC 
I II I I M I M II II II II II I II I I II II II I I I II I I I I II I M II I II I I 
Z 2 5 3 3 8 AGCGGGGCTCTGCATCTGTGGAATGTGACCCGCGCGGACGACGGCCTCTATCAGCTGCAC 
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2150 2160 2170 2180 2190 2200 

Hn540- 1 . Dna TGCCAGAACTCAGAGGGCACCGCTGAGGCGCTGTTGAAGCTGGACGTGCATTATGCTCCC 
I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
225333 TGCCAGAACTCTGAGGGCACCGCGGAAGCGCGGCTGCGGCTGGACGTGCACTATGCTCCC 

2170 2180 2190 2200 2210 2220 

2210 2220 2230 2240 2250 2260 

Hn54 0-1 . Dna ACCATCCGTGCCCTCCGGGACCCTACTGAGGTGAATGTTGGGGGTTCTGTGGACATAGTC 

I I I I I I i I I I I I I I I I I I I 1 I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I 

Z2 5338 ACCATCCGTGCCCTCCAGGACCCCACTGAGGTGAACGTCGGGGGTTCTGTGGACATAGTC 

2230 2240 2250 2260 2270 2280 

2270 2280 2290 2300 2310 2320 

Hn540-1 . Dna T GC AC C GT T GAC GC C AAT C C CAT C CT C C C AGAGAT GT T C AGC T GGGAGAGAC T GGGAGAA 

I I I ! I II II I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I 
22 53 38 T GC ACT GT C GAT GC CAAT C C CAT C CT C C C GGGC AT GT T CAAC T GGG AGAGACT GGGAGAA 

2290 2300 2310 2320 2330 2340 

2330 2340 2350 2360 2370 2380 

Hn5 4 0- 1 . Dna GAAGAGGAGGAT CT GAAC CT GGAC GACAT GGAGAAAGT T T C C AAGGGAT C C AC GGGGC GT 

II I I I I II I I I II I I I I I I I I I I I I I I I II I IMI I I II I I II I I I I I 

Z 2 5 3 3 8 GAT GAGGAGGAC C AGAGC CT GGAT GACAT GGAGAAGAT AT C C AGGGGAC CAAC GGGGC GC 

2350 2360 2370 2380 2390 2400 

2390 2400 2410 2420 2430 2440 

Hn540- 1 . Dna CTGCGGATTCGCCAAGCCAAGCTATCCCAGGCTGGTGCCTACCAGTGCATCGTGGACAAT 

I I I I I I ! I I I Ml I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Z 2 5 3 3 8 CTGCGGATTCACCATGCCAAACTGGCCCAGGCTGGCGCTTACCAGTGCATTGTGGACAAT 

2410 2420 2430 2440 2450 2460 

2450 24 60 2 47 0 2480 2490 2500 

Hn54 0-1 .Dna GGGGTGGCTCCTGCAGCCAGAGGACTGGTTCGTCTTGTCGTCCGATTTGCTCCCCAGGTG 

I M II I II IN Mil M I III I II I II II I III II I II I I I I II I I II I 
Z2533 8 GGGGTGGCGCCTCCAGCACGACGGCTGCTCCGTCTTGTTGT CAGATTTGCCCCCCAGGTG 

2470 2480 2490 2500 2510 2520 

2510 2520 2530 2540 2550 2560 

Hn54 0-1 . Dna GAT CAGC CT ACT CC CCT AACAAAAGT GGCT GC C GCT GGGGAC AGC AC C AGCT CAGCCACA 

II I 1 M M i II II II II II I II II II I Mill I I I II I M I II II Mill 

Z2 5 33 8 GAGCACCCCACTCCCCTAACTAAGGTGGCTGCAGCTGGAGACAGCACCAGTTCTGCCACC 

2530 2540 2550 2560 2570 2580 



2570 2580 2590 2600 2610 2620 

Hn54 0-1 . Dna CTGCACTGCCGTGCCCGGGGTGTCCCCAACATCGACTTCACTTGGACCAAAAACGGGGTC 
M II M II I I II I II I M II II II M I II M I M II II II II I I I I I II II II II 
Z2533 8 CTCCACTGCCGTGCCCGAGGTGTCCCCAACATCGTTTTCACTTGGACAAAAAACGGGGTC 

2590 2600 2610 2620 2630 2640 

2630 2640 2650 2660 2670 2680 

Hn5 4 0- 1 . Dna CCTCTGGATCTCCAAGACCCCAGGTACACAGAGCACAGGTACCACCAGGGTGTTSTCCAC 

I M M I M I II I I M II I II II I II II I M I II II M II I II II II M II II II I 

Z2 5338 C CT CT GGAT CT C CAAGAT C C CAGGTACACGGAGCACAC ATACCAC CAGGGT GGT GT CCAC 

2650 2660 2670 2680 2690 2700 

2690 2700 2710 2720 2730 2740 

Hn54 0-1 . Dna AGCAGCCTCTTGACCATCGCTAATGTGTCTGCGGCCCAGGACTATGCCCTCTTCAAATGC 

M I M I I I I I M I II I II M II II II II II II II II II I II I I I I I II III 
Z2533 8 AGCAGCCTCCTGACCATTGCCAACGTGTCTGCCGCCCAGGATTACGCCCTCTTCACATGT 

2710 2720 2730 2740 2750 2760 

2750 2760 2770. 2780 2790 2800 

Hn540-1 . Dna ACGGCCACCAATGCCCTTGGCTCTGACCACACCAACATCCAGCTCGTCAGCATCAGCCGC 
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Z25338 ACAGCCACCAACGCCCTTGGCTCGGACCAAACCAACATTCAACTTGTCAGCATCAGCCGC 

2770 2780 2790 2800 2810 2820 

2810 2820 2830 2840 2850 2860 

Hn540-1 , Dna CCTGACCCTCCACTGGGACTGAAGGTTGTCAGCATAAGCCCTCACTCGGTGGGGCTGGAG 
I I 1 I I I I I ! I I I III I I I I I I I I I ! i I ! I I I Mill I I I I I I I I I I I I 
Z2533 8 C CT GAC C C T C CAT C AGGAT T AAAGGT T GT GAGT CT GAC C C CAC ACT C C GT GGGGCT GGAG 

2830 2840 2850 2860 2870 2880 

2870 2880 2890 2900 2910 2920 

Hn540-1 . Dna TGGAAGCCTGGCTTTGATGGGGGTCTGCCTCAGAGGTTCCAAATCAGGTACGAGGCCCTC 

I I I I I I I ! I I I I ! I I I I I I I ! II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Z25338 TGGAAGCCTGGCTTTGATGGGGGCCTGCCACAGAGGTTCTGCATCAGGTATGAGGCCCTG 

2890 2900 2910 2920 2930 2940 

2930 2940 2950 2960 2970 2980 

Hn540-1 . Dna GAGACCCCAGGATTCCTCCACGTGGATGTCCTACCTACACAGGCCACTACCTTCACGCTG 
I ill I II ! I MM I ! I I II I I I II MM i I I II I I 1 I II I II II II II I 

Z2 533 8 GGGACTCCAGGGTTCCACTATGTGGATGTCGTACCACCCCAGGCCACCACCTTCACGCTG 

2950 2960 2970 2980 2990 3000 

2990 3000 3010 3020 3030 3040 

Hn540-1 . Dna ACTGGGCTGAAGCCTTCTACACGATATAGGATCTGGCTGTTGGCCAGCAATGCCCTGGGG 

I I I II i I I I I II I I I I I I MM III M II I II I I I I I I I I I II II I Mill 
Z2 53 3 8 ACTGGTCTACAGCCTTCTACAAGATACAGGGTCTGGCTGCTGGCCAGTAATGCCTTGGGG 

3010 3020 3030 3040 3050 3060 

3050 3060 3070 3080 3090 J 3100 

Hn54 0-1 . Dna GAC AGT GGAT T GAC GGACAAGGGGAT C C AG GT C T C C GT CAC T AC C C C AGGC C C C GAC C AG 

II II II I II II I I II II II I I II II I II M I I I II I I I II I i I II II I 
Z2 5338 GACAGTGGACTGGCTGACAAAGGGACCCAGCTTCCCATCACTACCCCAGGTCTCCACCAG 

3070 3080 3090 3100 3110 3120 



3110 3120 3130 3140 3150 3160 

Hn5 40-1 . Dna GCTCCTGAAGACACAGACCACCAGCTGCCCACAGAGCTGCCTCCAGGACCCCCAAGGCTG 
II Ml Ml I II I II II ! I II M I II II M Ml M I II 1 I I I I II I I 

Z 2 5 3 3 8 CCTTCTGGAGAACCTGAAGACCAGCTGCCCACAGAGCCACCTTCAGGACCCTCGGGGCTG 

3130 3140 3150 3160 3170 3180 

.3170 3180 3190 3200 3210 3220 

Hn5 4 0-1. Dna CCCCTGCTGCCTGTGCTCTTTGCAGTTGGTGGTCTTCTGCTGCTCTCCAATGCCTCCTGT 
I M I M I II II M II II I I M II I I II I I I II I I I II I I I I III I I I I I I M I 
Z2 533 8 CCCCTGCTGCCTGTGCTGTTCGCTCTTGGGGGGCTTCTGCTCCTCTCCAATGCCTCCTGT 

3190 3200 3210 3220 3230 3240 

3230 3240 3250 3260 3270 3280 

Hn540-1 . Dna GTTGGGGGTCTCCTCTGGCGGAGAAGACTGAGGCGCCTTGCTGAGGAGATCTCAGAGAAG 
I I I I I I I II I I II II I I I Mill Mill II I I II II I I II M I I II II II 
Z2533 8 GTCGGGGGGGTCCTCTGGCAGCGGAGACTCAGGCGTCTTGCTGAGGGCATCTCAGAGAAG 

3250 3260 3270 3280 3290 ~ 3300 

3290 3300 3310 3320 3330 3340 

Hn5 4 0- 1 . Dna ACAGAGGCAGGGTCGGAGGACAGGATCAGGAATGAATATGAGGAGAGTCAGTGGACT 
M I I M M I II II I I M II II I I II M II II I II I I M II II I II I I II II 

Z 2 5 3 3 8 AC AGAGGC AGGGT CGGAAGAGGAC CGAGT C AGGAACGAATAT GAGGAGAGCCAGT GGACA 

3310 3320 3330 3340 3350 3360 

3350 3360 3370 . 3380 3390 3400 

Hn5 4 0- 1 . Dna GGGGACC GGGACAC GAGAAGCT C CAC GGTT AGCAC AGCAGAAGT GGAC C CAAATTACT AC 
M I I II I II I I I I II II II I I II II II I I I II I I MM I I II I I 

Z 2 5 3 3 8 GGAGAGCGGGAC ACT CAGAGCTCC AG GGTCAGCACAAC AGAGGC AGAGCCGT ATT AC CGC 

3370 3380 3390 3400 3410 3420 



t fr [EDITOR- [540-4 . LOG] ] ^fc. 
I I M I I II II M M M M I M Mill 1 M M II M M i M M I 
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